خرید اقساطی از سایت کارت با کمترین پیش پرداخت

بایدو از ERNIE 5 رونمایی کرد؛ رقیبی جدی برای GPT-5 و جمینای


avatar
نازنین طالب لو
24 آبان 1404 | 3 دقیقه مطالعه

تنها یک روز پس از معرفی مدل GPT-5.1  توسط  OpenAI، شرکت چینی بایدو از مدل هوش مصنوعی جدید خود با نام ERNIE 5.0  رونمایی کرد. این مدل همه‌وجهی طراحی شده و قادر است به‌طور همزمان محتوا را در چهار حوزه متن، تصویر، صدا و ویدیو پردازش و تولید کند. برخلاف نسخه قبلی بایدو، یعنی ERNIE-4.5-VL  که به‌صورت متن‌باز عرضه شده بود،  ERNIE 5.0 کاملاً انحصاری است و تنها از طریق وب‌سایت ERNIE Bot و پلتفرم ابری Qianfan  از طریق API در دسترس کاربران قرار می‌گیرد. بایدو همچنین نسخه‌ای به نام ERNIE 5.0 Preview 1022 معرفی کرده که به‌طور ویژه برای پردازش‌های سنگین متنی بهینه شده است.

براساس بنچمارک‌های ارائه شده توسط بایدو، ERNIE 5.0  در طیف وسیعی از وظایف عملکردی برابر یا حتی فراتر از مدل رده‌بالای OpenAI یعنی GPT-5-High  و  Gemini 2.5 Pro ارائه می‌دهد. نقطه قوت اصلی این مدل در حوزه‌هایی است که برای کسب‌وکارها اهمیت حیاتی دارند؛ برای مثال در بنچمارک‌های OCRBench  (تشخیص نوری کاراکترها) و DocVQA  (پاسخ به سؤال بر اساس اسناد) توانسته است عملکرد بهتری نسبت به رقبای آمریکایی خود داشته باشد.

 معرفی ERNIE 5.0 نشان‌دهنده ورود بایدو به رقابت جدی در سطح جهانی با پیشروهای حوزه هوش مصنوعی است. به نظر من، تمرکز این مدل بر کاربردهای عملی و صنعتی، به ویژه در پردازش اسناد و داده‌های متنی، می‌تواند آن را به ابزاری کلیدی برای کسب‌وکارها و پژوهشگران تبدیل کند و مسیر رقابت بین مدل‌های هوش مصنوعی پیشرفته را جذاب‌تر و فشرده‌تر سازد.

ERNIE 5 بایدو؛ مدل هوش مصنوعی پیشرفته برای تحلیل داده و اسناد

مدل هوش مصنوعی جدید بایدو، ERNIE 5.0، در بنچمارک  ChartQA توانسته عملکرد برجسته‌ای در استدلال و تحلیل داده‌های ساختاریافته نمودارها از خود نشان دهد. بایدو معتقد است این ویژگی‌ها،  ERNIE 5.0 را به گزینه‌ای ایده‌آل برای پردازش خودکار اسناد و تحلیل‌های مالی تبدیل می‌کند.

در حوزه تولید تصویر، این مدل عملکردی برابر یا حتی بهتر از Veo3  گوگل ارائه می‌دهد و در کارهای صوتی و زبانی نیز رقابت‌پذیری خود را نشان داده است، هرچند تمرکز اصلی آن بر درک بصری و تحلیل اسناد بوده است.

 ERNIE 5.0 به‌عنوان یک مدل پریمیوم عرضه شده و قیمت آن نسبت به نسخه‌های قبلی مانند ERNIE 4.5 Turbo افزایش یافته است. با این حال، هزینه استفاده از آن در مقایسه با رقبای اصلی آمریکایی بسیار رقابتی است:

مدلهزینه ورودی (۱ میلیون توکن)هزینه خروجی (۱ میلیون توکن)
ERNIE 5.0 (Baidu)$0.85$3.40
GPT-5.1 (OpenAI)$1.25$10.00
Gemini 2.5 Pro (Google)$1.25 )تا ۲۰۰k($10.00 )تا ۲۰۰k(
Claude Opus 4.1 (Anthropic)$15.00$75.00
ERNIE 4.5 Turbo (Baidu)$0.11$0.45

رونمایی از ERNIE 5.0 بخشی از یک استراتژی گسترده بایدو است. این شرکت هم‌زمان محصولات دیگری مانند MeDo (پلتفرم ساخت اپلیکیشن بدون کد) و Oreate را عرضه کرده و سرویس تاکسی خودران Apollo Go را به ۲۲ شهر گسترش داده است.

با توجه به توانایی‌های برجسته ERNIE 5.0 در تحلیل اسناد، نمودارها و تولید محتوای چندرسانه‌ای، به نظر می‌رسد بایدو قصد دارد جایگاه خود را در بازار جهانی هوش مصنوعی مستحکم کند. قیمت رقابتی این مدل نسبت به همتایان آمریکایی نیز می‌تواند آن را به گزینه‌ای جذاب برای کسب‌وکارها و پژوهشگران تبدیل کند، به‌ویژه در حوزه‌های مالی و تحلیلی که دقت و سرعت پردازش اهمیت بالایی دارند.