تنها یک روز پس از معرفی مدل GPT-5.1 توسط OpenAI، شرکت چینی بایدو از مدل هوش مصنوعی جدید خود با نام ERNIE 5.0 رونمایی کرد. این مدل همهوجهی طراحی شده و قادر است بهطور همزمان محتوا را در چهار حوزه متن، تصویر، صدا و ویدیو پردازش و تولید کند. برخلاف نسخه قبلی بایدو، یعنی ERNIE-4.5-VL که بهصورت متنباز عرضه شده بود، ERNIE 5.0 کاملاً انحصاری است و تنها از طریق وبسایت ERNIE Bot و پلتفرم ابری Qianfan از طریق API در دسترس کاربران قرار میگیرد. بایدو همچنین نسخهای به نام ERNIE 5.0 Preview 1022 معرفی کرده که بهطور ویژه برای پردازشهای سنگین متنی بهینه شده است.
براساس بنچمارکهای ارائه شده توسط بایدو، ERNIE 5.0 در طیف وسیعی از وظایف عملکردی برابر یا حتی فراتر از مدل ردهبالای OpenAI یعنی GPT-5-High و Gemini 2.5 Pro ارائه میدهد. نقطه قوت اصلی این مدل در حوزههایی است که برای کسبوکارها اهمیت حیاتی دارند؛ برای مثال در بنچمارکهای OCRBench (تشخیص نوری کاراکترها) و DocVQA (پاسخ به سؤال بر اساس اسناد) توانسته است عملکرد بهتری نسبت به رقبای آمریکایی خود داشته باشد.
معرفی ERNIE 5.0 نشاندهنده ورود بایدو به رقابت جدی در سطح جهانی با پیشروهای حوزه هوش مصنوعی است. به نظر من، تمرکز این مدل بر کاربردهای عملی و صنعتی، به ویژه در پردازش اسناد و دادههای متنی، میتواند آن را به ابزاری کلیدی برای کسبوکارها و پژوهشگران تبدیل کند و مسیر رقابت بین مدلهای هوش مصنوعی پیشرفته را جذابتر و فشردهتر سازد.
ERNIE 5 بایدو؛ مدل هوش مصنوعی پیشرفته برای تحلیل داده و اسناد
مدل هوش مصنوعی جدید بایدو، ERNIE 5.0، در بنچمارک ChartQA توانسته عملکرد برجستهای در استدلال و تحلیل دادههای ساختاریافته نمودارها از خود نشان دهد. بایدو معتقد است این ویژگیها، ERNIE 5.0 را به گزینهای ایدهآل برای پردازش خودکار اسناد و تحلیلهای مالی تبدیل میکند.
در حوزه تولید تصویر، این مدل عملکردی برابر یا حتی بهتر از Veo3 گوگل ارائه میدهد و در کارهای صوتی و زبانی نیز رقابتپذیری خود را نشان داده است، هرچند تمرکز اصلی آن بر درک بصری و تحلیل اسناد بوده است.
ERNIE 5.0 بهعنوان یک مدل پریمیوم عرضه شده و قیمت آن نسبت به نسخههای قبلی مانند ERNIE 4.5 Turbo افزایش یافته است. با این حال، هزینه استفاده از آن در مقایسه با رقبای اصلی آمریکایی بسیار رقابتی است:
| مدل | هزینه ورودی (۱ میلیون توکن) | هزینه خروجی (۱ میلیون توکن) |
| ERNIE 5.0 (Baidu) | $0.85 | $3.40 |
| GPT-5.1 (OpenAI) | $1.25 | $10.00 |
| Gemini 2.5 Pro (Google) | $1.25 )تا ۲۰۰k( | $10.00 )تا ۲۰۰k( |
| Claude Opus 4.1 (Anthropic) | $15.00 | $75.00 |
| ERNIE 4.5 Turbo (Baidu) | $0.11 | $0.45 |
رونمایی از ERNIE 5.0 بخشی از یک استراتژی گسترده بایدو است. این شرکت همزمان محصولات دیگری مانند MeDo (پلتفرم ساخت اپلیکیشن بدون کد) و Oreate را عرضه کرده و سرویس تاکسی خودران Apollo Go را به ۲۲ شهر گسترش داده است.
با توجه به تواناییهای برجسته ERNIE 5.0 در تحلیل اسناد، نمودارها و تولید محتوای چندرسانهای، به نظر میرسد بایدو قصد دارد جایگاه خود را در بازار جهانی هوش مصنوعی مستحکم کند. قیمت رقابتی این مدل نسبت به همتایان آمریکایی نیز میتواند آن را به گزینهای جذاب برای کسبوکارها و پژوهشگران تبدیل کند، بهویژه در حوزههای مالی و تحلیلی که دقت و سرعت پردازش اهمیت بالایی دارند.
