کمپانی xAI، زیر نظر ایلان ماسک، نسخه ارتقایافته مدل هوش مصنوعی خود را با نام Grok 4.1 معرفی کرده است؛ مدلی که نسبت به نسل قبل نهتنها سریعتر و هوشمندتر شده، بلکه تواناییهای آن در پردازشهای خلاقانه، احساسی و مشارکتی بهطور محسوسی افزایش یافته است. این مدل در دو نسخه Grok 4.1 و Grok 4.1 Thinking ارائه میشود و هر دو برای عموم کاربران در دسترس هستند. البته مشترکان پریمیوم با محدودیتهای کمتری میتوانند از قابلیتهای این دو نسخه بهره ببرند.
براساس اطلاعات رسمی منتشرشده از سوی xAI، این مدل جدید نسبت به Grok 4 تا سه برابر کمتر دچار خطاهای هذیانی میشود و همین موضوع آن را به یکی از قابلاعتمادترین نسخههای ارائهشده توسط این شرکت تبدیل میکند. هنوز مقایسه دقیق آن با رقبایی مانند GPT 5.1 که اخیراً با تمرکز بر هوش هیجانی بهروزرسانی شده، مشخص نیست؛ اما دادههای اولیه نشان میدهد که Grok 4.1 در عملکرد پایه و تفکر تحلیلی حرفهای زیادی برای گفتن دارد.
نتایج ابزار بنچمارک متنباز LMArena Text Arena نیز این موضوع را تأیید میکند. در این تست، Grok 4.1 Thinking با کسب امتیاز ۱۴۸۳ در صدر جدول قرار گرفته و Grok 4.1 معمولی با امتیاز ۱۴۶۵ در جایگاه دوم ایستاده است؛ رکوردی که نشان میدهد xAI در مسیر ارتقای هوش مصنوعی خود گامهای جدی و موفقی برداشته است.
ورود Grok 4.1 نشان میدهد که رقابت بین مدلهای هوش مصنوعی به مرحلهای رسیده که دیگر فقط «توان محاسباتی» ملاک نیست؛ بلکه دقت، ثبات رفتاری، خلاقیت و تعامل احساسی اهمیت بسیار بیشتری پیدا کردهاند. اگر xAI بتواند همین روند را ادامه دهد و مدلهایش را از نوسانات و خطاهای معمول دور نگه دارد، Grok میتواند در کنار غولهایی مثل OpenAI و Google تبدیل به یک رقیب جدی و قابلاتکا شود. مخصوصاً نسخه Thinking که روی تحلیل عمیق تمرکز دارد، میتواند آینده مدلهای reasoning را دستخوش تغییر کند.
Grok 4.1؛ جهشی چشمگیر در بنچمارکها، اما نه لزوماً قهرمان بیرقیب سال
در تازهترین نتایج منتشرشده از پلتفرم Arena Expert، نسخه Grok 4.1 Thinking با امتیاز چشمگیر ۱۵۱۰ در صدر جدول جای گرفته است. نسخه استاندارد این مدل نیز با امتیاز ۱۴۳۷ در رتبه نوزدهم قرار دارد؛ فاصلهای که نشان میدهد نسخه Thinking با تمرکز بر استدلال عمیق و تحلیل چندمرحلهای عملکردی کاملاً برتر ارائه میدهد.
در بخش هوش هیجانی نیز عملکرد Grok قابلتوجه بوده است. در بنچمارک EQ-Bench3، نسخه Thinking امتیاز ۱۵۸۶ و نسخه معمولی امتیاز ۱۵۸۵ را کسب کردهاند؛ عددی که آنها را بالاتر از رقبایی مانند Gemini 2.5 Pro با امتیاز ۱۵۵۹ و GPT-5 Chat با امتیاز ۱۳۶۴ قرار میدهد. این نتایج نشان میدهد xAI موفق شده برخلاف تصور عمومی، Grok را تنها بهعنوان یک مدل خلاق یا طنزپرداز معرفی نکند، بلکه آن را به سطح بالایی از درک احساسی و تعامل انسانی نیز برساند.
با این حال، با وجود ارتقای چشمگیر Grok 4.1 نسبت به نسل قبل، نمیتوان آن را «قویترین مدل سال» دانست. گزارشها حاکی از آن است که گوگل در آستانه معرفی Gemini 3 قرار دارد؛ مدلی که احتمال میرود قدرتمندترین سیستم هوش مصنوعی این شرکت تا امروز باشد و رقابت را وارد مرحله جدیدی کند.
xAI اعلام کرده که Grok 4.1 اکنون برای همه کاربران در وبسایت رسمی، شبکه اجتماعی ایکس و اپلیکیشنهای اندروید و iOS در دسترس است. این مدل بهصورت خودکار روی بسیاری از پلتفرمها فعال میشود و در صورت نیاز، امکان انتخاب دستی آن نیز از بخش تنظیمات وجود دارد.
Grok 4.1 بیش از آنکه یک بهروزرسانی معمولی باشد، نشاندهنده جدیت xAI در رقابت مستقیم با غولهای هوش مصنوعی است. عملکرد فوقالعاده آن در بنچمارکها بهخصوص در زمینه هوش هیجانی، این پیام را میدهد که هوش مصنوعی آینده صرفاً بر پایه قدرت محاسباتی قضاوت نمیشود، بلکه «درک احساس» و «تعامل انسانی» نیز به معیاری حیاتی تبدیل شده است. البته با نزدیکشدن معرفی Gemini 3، هنوز نمیتوان تاج بهترین مدل سال را به Grok داد؛ اما بیشک اکنون یکی از شانسهای اصلی این رقابت است و نشان داده که xAI دیگر یک بازیگر حاشیهای نیست، بلکه یک رقیب جدی و خلاق در میدان هوش مصنوعی است.
