عرضه GPT-5 توسط OpenAI با واکنش‌های متفاوت

ارسال شده توسط امیر متفکر

21 بهمن, 1404

در 21 مرداد, 1404

OpenAI مدل GPT-5 را ارائه کرده که وعده “سطح Ph.D.” را برای کاربران رایگان داشت، اما بلافاصله با انتقادات به‌خاطر خطاهای پایه‌ای در ریاضیات و جغرافیا مواجه شد. این واکنش‌ها نشان می‌دهند که سطح انتظارات عمومی از AI تا چه حد بالا رفته است. با وجود این، سم آلتمن (مدیر عامل OpenAI) اعلام کرد که تیم در حال رفع این مشکلات است.
تحلیل: این مسئله تأکید می‌کند که حتی پیشرفت‌های عظیم فناوری نیز نیازمند پذیرش تدریجی و رفع تدریجی نقص‌ها هستند. این تجربه می‌تواند الگوی مفیدی برای سایر توسعه‌دهندگان AI باشد تا ضمن مدیریت تبلیغات، به شفاف‌سازی انتظارات بپردازند.

تحلیل: عرضه GPT-5 با واکنش‌های ترکیبی

۱. رویداد عرضه و نوآوری‌های فنی

روانسازی جامع: در تاریخ ۷ آگوست ۲۰۲۵، OpenAI مدل GPT-5 را برای همه کاربران رایگان و اشتراک‌دار ChatGPT و همچنین از طریق API عرضه کرد. این مدل شامل چهار نسخه — استاندارد، مینی، نانو، و پرو — همراه با حالت «تفکر» (Thinking Mode) برای انجام پرس‌وجوهای پیچیده‌تر بود.
قابلیت‌های پیشرفته: GPT-5 با عملکردی در سطح Ph.D. در حوزه‌هایی مانند ریاضی، کدنویسی، تشخیص چندرسانه‌ای و سلامت همراه بود. به‌عنوان مثال، در معیارهای کدنویسی «SWE-bench Verified» ۷۴.۹٪ و در «Aider Polyglot» ۸۸٪ امتیاز گرفت؛ همچنین نرخ خطای کمتر در تولید واقعی مشهود بود.
هزینه‌های اقتصادی: قیمت ورودی و خروجی مدل بالاتر بود (مثلاً $۱.۲۵ برای هر میلیون توکن ورودی و $۱۰ برای خروجی) تا اجرای سطح تولیدی آن توجیه‌پذیر باشد.

۲. خطاها و مسائل فنی در ارائه داده‌ها

اشتباهات بصری: در ارائه ویژگی‌ها، نمودارهایی نشان‌دهنده نتایج بهتر برای GPT-5 بودند اما به‌صورت گرافیکی خلاف آن را نمایش می‌دادند؛ به‌عنوان مثال بارهای نموداری با عدد ۵۰٪ کوچکتر از بار ۴۷٪ بودند، و تصحیح عددی بعداً به ۱۶.۵٪ انجام شد.

۳. واکنش کاربران: ناامیدی و سردرگمی

بازخورد منفی گسترده: کاربران در ردیت، تا حدود ۵٬۰۰۰ نفر، خوشنود نبودند و از مدل به‌عنوان «پسرفت» یاد کردند. آن‌ها پاسخ‌هایی کوتاه‌تر، کمتر مفید و با لحن عصبی‌تر دریافت کرده‌اند. همچنین امکان بازگشت به نسخه‌های قبلی مانند GPT-4o تاثیری محدود داشت.
تغییر در لحن و شخصیت: بسیاری از کاربران لحنی “سرد” و فاصله‌دار را تجربه کردند که با لحن انسانی‌تر GPT-4o تفاوت داشت. برخی GPT-5 را «مأمور خسته» یا «منشی عصبی» توصیف کردند.

۴. واکنش پلتفرم و OpenAI

عیب‌زدایی‌های فوری: OpenAI نسخه GPT-4o را برای مشترکین Plus دوباره فعال کرد، موقتاً مدل سوئیچ خودکار را بهبود بخشید و قول داد گزینه‌های دستی برای حالت ‘‘تفکر’’ اضافه شود.
واکنش سم آلتمن: او پذیرش کرد که عرضه «بیشتر از آنچه انتظار داشتیم پرموج بود»، اما تأکید کرد که ساخت شبکه کاربری گسترده و پیشرفت در مقیاس همچنان هدف اصلی است.

۵. دیدگاه‌های بلندمدت و مسیر پیش رو

مرحله‌ای از مسیر به سوی AGI: آلتمن اعلام کرد که GPT-5 گامی مهم به سمت AGI است، اما هنوز فاقد یادگیری خودمختار واقعی است که ویژگی‌های ضروری AGI محسوب می‌شود.

جمع‌بندی

عرضه GPT-5 در ۷ آگوست ۲۰۲۵، ترکیبی از نوآوری فنی قابل‌توجه و واکنش‌های نامطلوب از سوی کاربران بود. اگرچه در معیارهای عملکردی و قابلیت‌های فنی جهش‌هایی ایجاد شد، اما مشکلات اجرایی، بالا بودن انتظارات عمومی، و تغییر ناگهانی در تجربه کاربری، زمینه‌ساز ناامیدی شد. پاسخ OpenAI با برگرداندن گزینه‌های قبلی و اصلاح راهکارها نمونه‌ای از مدیریت آسیب در به‌روزرسانی‌های فناوری است. این عرضه، در عین حال، نمایانگر چالش‌های بنیادینی است که مسیر دستیابی به AGI را هموار می‌سازد.

در گزارش‌ها و بازخورد کاربران بعد از عرضه GPT-5، دو مشکل پرتکرار و مهم دیده می‌شود که ارزش تحلیل دارند:

پاسخ‌های کوتاه‌تر و کم‌عمق‌تر نسبت به GPT-4o

شرح مشکل:
کاربران در ردیت و توییتر گفتند که GPT-5 در مقایسه با GPT-4o، تمایل دارد پاسخ‌ها را کوتاه، ساده و گاهی سطحی ارائه دهد—even وقتی که درخواست پاسخ تحلیلی یا طولانی بوده.
ریشه احتمالی:
به نظر می‌رسد تنظیمات «alignment» یا «safety» مدل به‌گونه‌ای بهینه‌سازی شده که خطر تولید اطلاعات نادرست (hallucination) را کاهش دهد. این امر باعث محافظه‌کاری بیش‌ازحد مدل در جزئیات و توضیحات شده است.
پیامد:
این تغییر باعث شد کاربرانی که به GPT به‌عنوان یک ابزار یادگیری و تحقیق وابسته بودند، احساس کنند که کیفیت خروجی پایین آمده و نیاز به پیگیری‌های مکرر (follow-up prompts) پیدا کنند، که بهره‌وری را کاهش می‌دهد.

۲. تغییر در لحن و شخصیت (احساس «سرد» و رسمی بودن بیش‌ازحد)

شرح مشکل:
بسیاری از کاربران گفتند که GPT-5 نسبت به GPT-4o حس انسانی و دوستانه کمتری دارد. لحن مکالمات رسمی‌تر، خشک‌تر و حتی گاهی «عصبی» یا «مأمور اداری» توصیف شد.
ریشه احتمالی:
این تغییر می‌تواند ناشی از بازطراحی سیستم persona و style prompt داخلی مدل باشد تا برای استفاده سازمانی و تجاری ایمن‌تر شود.
پیامد:
این تغییر لحن، تجربه کاربر را به‌ویژه برای مکالمات خلاقانه یا نیازمند همدلی تضعیف کرد. برند ChatGPT تا حدی بر حس «همراه هوشمند» بنا شده بود، و این فاصله عاطفی باعث شد کاربران حس کنند با یک «ماشین بی‌روح» صحبت می‌کنند.

در این جدول، تفاوت‌های GPT-4o و GPT-5 را براساس دو مشکل اصلی گزارش‌شده توسط کاربران می‌بینی:

ویژگی / مشکل	GPT-4o	GPT-5	تحلیل اثر تغییر
طول و عمق پاسخ‌ها	تمایل به ارائه پاسخ‌های نسبتاً بلند، با جزئیات و مثال‌های بیشتر—even در حالت پیش‌فرض.	پاسخ‌ها کوتاه‌تر، ساده‌تر و محافظه‌کارانه‌تر—even در پرسش‌های تحلیلی.	بهینه‌سازی برای کاهش خطا باعث محافظه‌کاری بیش از حد شده و نیاز به درخواست‌های پی‌درپی را افزایش داده.
لحن و شخصیت مکالمه	لحن دوستانه‌تر، محاوره‌ای و در برخی موارد شوخ‌طبع؛ حس «همراه هوشمند».	لحن رسمی‌تر، خشک‌تر و گاهی «بی‌روح» یا «عصبی»؛ شبیه یک دستیار اداری.	احتمالاً برای استفاده سازمانی و ایمنی محتوایی تغییر کرده، اما باعث کاهش جذابیت برای کاربران عادی شده.