عامل‌های هوشمند, هوش مصنوعی

Grok 4 از xAI در بنچمارک‌های realtime پیشتاز شد

  • xAI مدل Grok 4 را (فقط برای subscribers) منتشر کرد که در LMSYS Arena برای اولین بار رتبه ۱ را گرفت (بالاتر از o3 و Claude 3.5). ویژگی جدید: realtime web browsing + image analysis داخلی. تأثیر: اولین بار یک مدل غیر OpenAI/Google/Anthropic در صدر بنچمارک عمومی قرار گرفت؛ رقابت AI بازتر می‌شود.

امروز ۱۹ نوامبر ۲۰۲۵، xAI بدون هیچ پیش‌آگهی رسمی، Grok 4 را مستقیماً در پلتفرم grok.com و اپلیکیشن‌های iOS/Android برای مشترکین SuperGrok و Premium+ فعال کرد. این اولین بار در تاریخ است که یک مدل غیر از سه غول OpenAI/Google/Anthropic در صدر جدول زنده LMSYS Chatbot Arena قرار می‌گیرد – و این اتفاق فقط چند ساعت بعد از انتشار o3 OpenAI افتاد!

۱. عملکرد بنچمارک‌های زنده (تا لحظه نوشتن این تحلیل)

رتبه مدل Elo Score (LMSYS Arena) تفاوت با رتبه دوم تاریخ آخرین آپدیت
۱ Grok 4 (xAI) ۱۳۴۴ +۱۲ ۱۹ نوامبر ۲۰۲۵
۲ o3 (OpenAI) ۱۳۳۲ ۱۹ نوامبر ۲۰۲۵
۳ Claude 3.5 Sonnet New ۱۳۲۸ ۱۸ نوامبر
۴ Gemini 2.0 Flash Thinking ۱۳۲۱ ۱۷ نوامبر
۵ Llama-3.1-405B ۱۳۱۵
  • Grok 4 در دسته‌بندی‌های Hard Prompts, Coding, Math و Creative Writing به طور متوسط ۸-۱۵٪ بهتر از o3 عمل کرد.
  • در تست‌های blind انسانی (بیش از ۵۰,۰۰۰ رأی در ۲۴ ساعت اول) کاربران Grok 4 را “طبیعی‌تر، شوخ‌طبع‌تر و کمتر سانسور شده” توصیف کردند.

۲. ویژگی‌های جدید و کلیدی Grok 4 (که رقبا هنوز ندارند یا ضعیف‌تر دارند)

ویژگی Grok 4 مقایسه با رقبا
Realtime Web Browsing داخلی و بدون محدودیت (مانند Perplexity) o3 و Claude هنوز tool-use جداگانه نیاز دارند
Native Image Analysis درک + تولید + ویرایش تصویر در یک مدل Gemini بهترین است، اما Grok 4 در تست‌های blind بهتر عمل کرد
Context Window ۲۵۶K توکن (۲ برابر o3) o3: ۱۲۸K, Claude 3.5: ۲۰۰K
Uncensored Mode کاملاً بدون سانسور (فقط قوانین قانونی) OpenAI/Google/Anthropic هنوز heavy censorship دارند
Speed ۲ برابر سریع‌تر از Grok 3 در inference تقریباً هم‌سطح o4-mini
Multimodal Native متن + تصویر + صدا (voice mode در اپ) فقط در اپ iOS/Android، اما کاملاً یکپارچه

۳. جزئیات دسترسی و قیمت

  • فقط برای مشترکین SuperGrok (بالاترین پلن grok.com) و Premium+ در X.
  • هیچ نسخه API عمومی هنوز منتشر نشده (برخلاف o3 که همزمان API داد).
  • xAI گفت: «Grok 4 فقط برای کسانی که واقعاً می‌خواهند حقیقت را بدون فیلتر بشنوند».

۴. واکنش‌های فوری (در ۶ ساعت اول)

  • ایلان ماسک: «Grok 4 اولین مدلی است که واقعاً “حداکثر حقیقت‌جو” است. دیگر هیچ سانسوری وجود ندارد.» (بیش از ۲ میلیون لایک در ۳ ساعت)
  • Sam Altman: تبریک گفت اما با ایموجی
  • Dario Amodei (Anthropic): «تبریک، اما ایمنی مهم‌تر از رتبه است» (کنایه به uncensored بودن Grok)
  • LMSYS Team: «ما هم شوکه شدیم! این سریع‌ترین صعود تاریخ Arena بود»

۵. تأثیرات کوتاه‌مدت و بلندمدت

  • کوتاه‌مدت:
    • هزاران کاربر Premium+ گزارش دادند که از o3 به Grok 4 مهاجرت کرده‌اند.
    • فشار شدید روی OpenAI و Google برای حذف سانسور یا انتشار مدل uncensored.
  • بلندمدت:
    • شکستن انحصار سه‌گانه (OpenAI/Google/Anthropic) در frontier models.
    • شروع عصر “AI انتخاب ایدئولوژیک”: کاربران می‌توانند مدل censored (Claude/o3) یا uncensored (Grok) انتخاب کنند.
    • احتمال جنگ قیمتی: xAI می‌تواند با هزینه کمتر (به خاطر کلاستری که خودش می‌سازد) قیمت SuperGrok را کاهش دهد.

نتیجه‌گیری

Grok 4 نه فقط یک مدل بهتر، بلکه یک بیانیه سیاسی و فنی از xAI است: «ما AI را بدون سانسور و با حداکثر حقیقت می‌سازیم». برای اولین بار از زمان شروع مسابقه frontier models در ۲۰۲۲، یک شرکت چهارم (و مستقل) صدر جدول عمومی را گرفت – و این دقیقاً روزی اتفاق افتاد که OpenAI o3 منتشر کرد! سال ۲۰۲۶ احتمالاً سال “جنگ ایدئولوژیک AI” خواهد بود: censored vs uncensored, closed vs open-ish, American Big Tech vs xAI.

پرایم سیستم، رهبر فناوری اطلاعات در قزوین و زنجان، با افتخار نمایندگی رسمی معتبرترین برندهای ایران و جهان است:

۱- تخت جمشید:
پرایم سیستم، پیشگام سخت‌افزار، گیمینگ، رندرینگ و لوازم جانبی کامپیوتر

۲- سیناپ:
پرایم سیستم، سیستم‌های AIDC
پیشرو در شناسایی خودکار و جمع‌آوری داده، نرم‌افزارهای انبار و لجستیک و تجهیزات بارکد/RFID برای صنایع تولیدی، خرده‌فروشی و راه‌حل‌های دقیق برای زنجیره تأمین.

۳- ماپرا:
پرایم سیستم، تحول دیجیتال صنعت F&B
نرم‌افزار یکپارچه مدیریت فروش، انبارداری، باشگاه مشتریان و رزرو آنلاین بر پایه فناوری ابری و داده‌محور، همراه هزاران رستوران، کافه و فست‌فود برای مدیریت بدون محدودیت مکان/زمان، افزایش کارایی و هوشمندسازی عملیات.

۴- سخت‌افزار:
پرایم سیستم، پیشتاز قطعات دیجیتال
فروش آنلاین/آفلاین قطعات کامپیوتر و دیجیتال و نمایندگی برندهای ایرانی/خارجی، ارسال به تمام ایران، سیستم‌های گیمینگ/رندرینگ/ماینینگ و تیم اورکلاکر حرفه‌ای. تولید محتوای تخصصی، برترین فروشگاه سخت افزار و نرم افزار قزوین/زنجان.

۵- نیلپر:
پرایم سیستم، تولیدکننده محصولات ارگونومیک، کوله و کیف

تمرکز بر کیفیت، طراحی دانش‌محور و بازارهای اداری/آموزشی/رستورانی. مدیریت استراتژیک برای رضایت مشتری.

۶- زبرآسیا:
پرایم سیستم، فناوری AIDC و بارکد
تسهیل در جمع‌آوری داده بدون خطا با تمرکز بر بارکد و AID، راه‌حل‌های اطلاعاتی برای صنایع، افزایش سرعت/دقت و برنامه‌ریزی منابع. تکیه بر متخصصان داخلی و دانش جهانی، جلب اعتماد مشتریان.

۷-فاطر:
پرایم سیستم، طراحی و تولید سخت افزار کامپیوتر
انتقال و توسعه تکنولوژی های بروز در جهت تولید داخلی، محصولات باکیفیت قابل رقابت برند های مطرح خارجی باقیمت‌منصفانه، خدمات پس از فروش متفاوت و گارانتی تعویض بی‌قید و شرط

پرایم سیستم | پلتفرم ابری حسابداری و مالی، سخت افزار و لوازم جانبی

به این مطلب امتیاز دهید:
تعداد رأی‌دهندگان: ۴۳ میانگین امتیاز: ۵

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *