blog
Grok 4 از xAI در بنچمارکهای realtime پیشتاز شد
- xAI مدل Grok 4 را (فقط برای subscribers) منتشر کرد که در LMSYS Arena برای اولین بار رتبه ۱ را گرفت (بالاتر از o3 و Claude 3.5). ویژگی جدید: realtime web browsing + image analysis داخلی. تأثیر: اولین بار یک مدل غیر OpenAI/Google/Anthropic در صدر بنچمارک عمومی قرار گرفت؛ رقابت AI بازتر میشود.
امروز ۱۹ نوامبر ۲۰۲۵، xAI بدون هیچ پیشآگهی رسمی، Grok 4 را مستقیماً در پلتفرم grok.com و اپلیکیشنهای iOS/Android برای مشترکین SuperGrok و Premium+ فعال کرد. این اولین بار در تاریخ است که یک مدل غیر از سه غول OpenAI/Google/Anthropic در صدر جدول زنده LMSYS Chatbot Arena قرار میگیرد – و این اتفاق فقط چند ساعت بعد از انتشار o3 OpenAI افتاد!
۱. عملکرد بنچمارکهای زنده (تا لحظه نوشتن این تحلیل)
| رتبه | مدل | Elo Score (LMSYS Arena) | تفاوت با رتبه دوم | تاریخ آخرین آپدیت |
|---|---|---|---|---|
| ۱ | Grok 4 (xAI) | ۱۳۴۴ | +۱۲ | ۱۹ نوامبر ۲۰۲۵ |
| ۲ | o3 (OpenAI) | ۱۳۳۲ | – | ۱۹ نوامبر ۲۰۲۵ |
| ۳ | Claude 3.5 Sonnet New | ۱۳۲۸ | – | ۱۸ نوامبر |
| ۴ | Gemini 2.0 Flash Thinking | ۱۳۲۱ | – | ۱۷ نوامبر |
| ۵ | Llama-3.1-405B | ۱۳۱۵ | – | – |
- Grok 4 در دستهبندیهای Hard Prompts, Coding, Math و Creative Writing به طور متوسط ۸-۱۵٪ بهتر از o3 عمل کرد.
- در تستهای blind انسانی (بیش از ۵۰,۰۰۰ رأی در ۲۴ ساعت اول) کاربران Grok 4 را “طبیعیتر، شوخطبعتر و کمتر سانسور شده” توصیف کردند.
۲. ویژگیهای جدید و کلیدی Grok 4 (که رقبا هنوز ندارند یا ضعیفتر دارند)
| ویژگی | Grok 4 | مقایسه با رقبا |
|---|---|---|
| Realtime Web Browsing | داخلی و بدون محدودیت (مانند Perplexity) | o3 و Claude هنوز tool-use جداگانه نیاز دارند |
| Native Image Analysis | درک + تولید + ویرایش تصویر در یک مدل | Gemini بهترین است، اما Grok 4 در تستهای blind بهتر عمل کرد |
| Context Window | ۲۵۶K توکن (۲ برابر o3) | o3: ۱۲۸K, Claude 3.5: ۲۰۰K |
| Uncensored Mode | کاملاً بدون سانسور (فقط قوانین قانونی) | OpenAI/Google/Anthropic هنوز heavy censorship دارند |
| Speed | ۲ برابر سریعتر از Grok 3 در inference | تقریباً همسطح o4-mini |
| Multimodal Native | متن + تصویر + صدا (voice mode در اپ) | فقط در اپ iOS/Android، اما کاملاً یکپارچه |
۳. جزئیات دسترسی و قیمت
- فقط برای مشترکین SuperGrok (بالاترین پلن grok.com) و Premium+ در X.
- هیچ نسخه API عمومی هنوز منتشر نشده (برخلاف o3 که همزمان API داد).
- xAI گفت: «Grok 4 فقط برای کسانی که واقعاً میخواهند حقیقت را بدون فیلتر بشنوند».
۴. واکنشهای فوری (در ۶ ساعت اول)
- ایلان ماسک: «Grok 4 اولین مدلی است که واقعاً “حداکثر حقیقتجو” است. دیگر هیچ سانسوری وجود ندارد.» (بیش از ۲ میلیون لایک در ۳ ساعت)
- Sam Altman: تبریک گفت اما با ایموجی
- Dario Amodei (Anthropic): «تبریک، اما ایمنی مهمتر از رتبه است» (کنایه به uncensored بودن Grok)
- LMSYS Team: «ما هم شوکه شدیم! این سریعترین صعود تاریخ Arena بود»
۵. تأثیرات کوتاهمدت و بلندمدت
- کوتاهمدت:
- هزاران کاربر Premium+ گزارش دادند که از o3 به Grok 4 مهاجرت کردهاند.
- فشار شدید روی OpenAI و Google برای حذف سانسور یا انتشار مدل uncensored.
- بلندمدت:
- شکستن انحصار سهگانه (OpenAI/Google/Anthropic) در frontier models.
- شروع عصر “AI انتخاب ایدئولوژیک”: کاربران میتوانند مدل censored (Claude/o3) یا uncensored (Grok) انتخاب کنند.
- احتمال جنگ قیمتی: xAI میتواند با هزینه کمتر (به خاطر کلاستری که خودش میسازد) قیمت SuperGrok را کاهش دهد.
نتیجهگیری
Grok 4 نه فقط یک مدل بهتر، بلکه یک بیانیه سیاسی و فنی از xAI است: «ما AI را بدون سانسور و با حداکثر حقیقت میسازیم». برای اولین بار از زمان شروع مسابقه frontier models در ۲۰۲۲، یک شرکت چهارم (و مستقل) صدر جدول عمومی را گرفت – و این دقیقاً روزی اتفاق افتاد که OpenAI o3 منتشر کرد! سال ۲۰۲۶ احتمالاً سال “جنگ ایدئولوژیک AI” خواهد بود: censored vs uncensored, closed vs open-ish, American Big Tech vs xAI.
پرایم سیستم، رهبر فناوری اطلاعات در قزوین و زنجان، با افتخار نمایندگی رسمی معتبرترین برندهای ایران و جهان است:
۱- تخت جمشید:
پرایم سیستم، پیشگام سختافزار، گیمینگ، رندرینگ و لوازم جانبی کامپیوتر
۲- سیناپ:
پرایم سیستم، سیستمهای AIDC
پیشرو در شناسایی خودکار و جمعآوری داده، نرمافزارهای انبار و لجستیک و تجهیزات بارکد/RFID برای صنایع تولیدی، خردهفروشی و راهحلهای دقیق برای زنجیره تأمین.
۳- ماپرا:
پرایم سیستم، تحول دیجیتال صنعت F&B
نرمافزار یکپارچه مدیریت فروش، انبارداری، باشگاه مشتریان و رزرو آنلاین بر پایه فناوری ابری و دادهمحور، همراه هزاران رستوران، کافه و فستفود برای مدیریت بدون محدودیت مکان/زمان، افزایش کارایی و هوشمندسازی عملیات.
۴- سختافزار:
پرایم سیستم، پیشتاز قطعات دیجیتال
فروش آنلاین/آفلاین قطعات کامپیوتر و دیجیتال و نمایندگی برندهای ایرانی/خارجی، ارسال به تمام ایران، سیستمهای گیمینگ/رندرینگ/ماینینگ و تیم اورکلاکر حرفهای. تولید محتوای تخصصی، برترین فروشگاه سخت افزار و نرم افزار قزوین/زنجان.
۵- نیلپر:
پرایم سیستم، تولیدکننده محصولات ارگونومیک، کوله و کیف
تمرکز بر کیفیت، طراحی دانشمحور و بازارهای اداری/آموزشی/رستورانی. مدیریت استراتژیک برای رضایت مشتری.
۶- زبرآسیا:
پرایم سیستم، فناوری AIDC و بارکد
تسهیل در جمعآوری داده بدون خطا با تمرکز بر بارکد و AID، راهحلهای اطلاعاتی برای صنایع، افزایش سرعت/دقت و برنامهریزی منابع. تکیه بر متخصصان داخلی و دانش جهانی، جلب اعتماد مشتریان.
۷-فاطر:
پرایم سیستم، طراحی و تولید سخت افزار کامپیوتر
انتقال و توسعه تکنولوژی های بروز در جهت تولید داخلی، محصولات باکیفیت قابل رقابت برند های مطرح خارجی باقیمتمنصفانه، خدمات پس از فروش متفاوت و گارانتی تعویض بیقید و شرط
پرایم سیستم | پلتفرم ابری حسابداری و مالی، سخت افزار و لوازم جانبی