blog
عرضه GPT-5 توسط OpenAI با واکنشهای متفاوت
OpenAI مدل GPT-5 را ارائه کرده که وعده “سطح Ph.D.” را برای کاربران رایگان داشت، اما بلافاصله با انتقادات بهخاطر خطاهای پایهای در ریاضیات و جغرافیا مواجه شد. این واکنشها نشان میدهند که سطح انتظارات عمومی از AI تا چه حد بالا رفته است. با وجود این، سم آلتمن (مدیر عامل OpenAI) اعلام کرد که تیم در حال رفع این مشکلات است.
تحلیل: این مسئله تأکید میکند که حتی پیشرفتهای عظیم فناوری نیز نیازمند پذیرش تدریجی و رفع تدریجی نقصها هستند. این تجربه میتواند الگوی مفیدی برای سایر توسعهدهندگان AI باشد تا ضمن مدیریت تبلیغات، به شفافسازی انتظارات بپردازند.
تحلیل: عرضه GPT-5 با واکنشهای ترکیبی
۱. رویداد عرضه و نوآوریهای فنی
- روانسازی جامع: در تاریخ ۷ آگوست ۲۰۲۵، OpenAI مدل GPT-5 را برای همه کاربران رایگان و اشتراکدار ChatGPT و همچنین از طریق API عرضه کرد. این مدل شامل چهار نسخه — استاندارد، مینی، نانو، و پرو — همراه با حالت «تفکر» (Thinking Mode) برای انجام پرسوجوهای پیچیدهتر بود.
- قابلیتهای پیشرفته: GPT-5 با عملکردی در سطح Ph.D. در حوزههایی مانند ریاضی، کدنویسی، تشخیص چندرسانهای و سلامت همراه بود. بهعنوان مثال، در معیارهای کدنویسی «SWE-bench Verified» ۷۴.۹٪ و در «Aider Polyglot» ۸۸٪ امتیاز گرفت؛ همچنین نرخ خطای کمتر در تولید واقعی مشهود بود.
- هزینههای اقتصادی: قیمت ورودی و خروجی مدل بالاتر بود (مثلاً $۱.۲۵ برای هر میلیون توکن ورودی و $۱۰ برای خروجی) تا اجرای سطح تولیدی آن توجیهپذیر باشد.
۲. خطاها و مسائل فنی در ارائه دادهها
- اشتباهات بصری: در ارائه ویژگیها، نمودارهایی نشاندهنده نتایج بهتر برای GPT-5 بودند اما بهصورت گرافیکی خلاف آن را نمایش میدادند؛ بهعنوان مثال بارهای نموداری با عدد ۵۰٪ کوچکتر از بار ۴۷٪ بودند، و تصحیح عددی بعداً به ۱۶.۵٪ انجام شد.
۳. واکنش کاربران: ناامیدی و سردرگمی
- بازخورد منفی گسترده: کاربران در ردیت، تا حدود ۵٬۰۰۰ نفر، خوشنود نبودند و از مدل بهعنوان «پسرفت» یاد کردند. آنها پاسخهایی کوتاهتر، کمتر مفید و با لحن عصبیتر دریافت کردهاند. همچنین امکان بازگشت به نسخههای قبلی مانند GPT-4o تاثیری محدود داشت.
- تغییر در لحن و شخصیت: بسیاری از کاربران لحنی “سرد” و فاصلهدار را تجربه کردند که با لحن انسانیتر GPT-4o تفاوت داشت. برخی GPT-5 را «مأمور خسته» یا «منشی عصبی» توصیف کردند.
۴. واکنش پلتفرم و OpenAI
- عیبزداییهای فوری: OpenAI نسخه GPT-4o را برای مشترکین Plus دوباره فعال کرد، موقتاً مدل سوئیچ خودکار را بهبود بخشید و قول داد گزینههای دستی برای حالت ‘‘تفکر’’ اضافه شود.
- واکنش سم آلتمن: او پذیرش کرد که عرضه «بیشتر از آنچه انتظار داشتیم پرموج بود»، اما تأکید کرد که ساخت شبکه کاربری گسترده و پیشرفت در مقیاس همچنان هدف اصلی است.
۵. دیدگاههای بلندمدت و مسیر پیش رو
- مرحلهای از مسیر به سوی AGI: آلتمن اعلام کرد که GPT-5 گامی مهم به سمت AGI است، اما هنوز فاقد یادگیری خودمختار واقعی است که ویژگیهای ضروری AGI محسوب میشود.
جمعبندی
عرضه GPT-5 در ۷ آگوست ۲۰۲۵، ترکیبی از نوآوری فنی قابلتوجه و واکنشهای نامطلوب از سوی کاربران بود. اگرچه در معیارهای عملکردی و قابلیتهای فنی جهشهایی ایجاد شد، اما مشکلات اجرایی، بالا بودن انتظارات عمومی، و تغییر ناگهانی در تجربه کاربری، زمینهساز ناامیدی شد. پاسخ OpenAI با برگرداندن گزینههای قبلی و اصلاح راهکارها نمونهای از مدیریت آسیب در بهروزرسانیهای فناوری است. این عرضه، در عین حال، نمایانگر چالشهای بنیادینی است که مسیر دستیابی به AGI را هموار میسازد.
در گزارشها و بازخورد کاربران بعد از عرضه GPT-5، دو مشکل پرتکرار و مهم دیده میشود که ارزش تحلیل دارند:
پاسخهای کوتاهتر و کمعمقتر نسبت به GPT-4o
- شرح مشکل:
کاربران در ردیت و توییتر گفتند که GPT-5 در مقایسه با GPT-4o، تمایل دارد پاسخها را کوتاه، ساده و گاهی سطحی ارائه دهد—even وقتی که درخواست پاسخ تحلیلی یا طولانی بوده. - ریشه احتمالی:
به نظر میرسد تنظیمات «alignment» یا «safety» مدل بهگونهای بهینهسازی شده که خطر تولید اطلاعات نادرست (hallucination) را کاهش دهد. این امر باعث محافظهکاری بیشازحد مدل در جزئیات و توضیحات شده است. - پیامد:
این تغییر باعث شد کاربرانی که به GPT بهعنوان یک ابزار یادگیری و تحقیق وابسته بودند، احساس کنند که کیفیت خروجی پایین آمده و نیاز به پیگیریهای مکرر (follow-up prompts) پیدا کنند، که بهرهوری را کاهش میدهد.
۲. تغییر در لحن و شخصیت (احساس «سرد» و رسمی بودن بیشازحد)
- شرح مشکل:
بسیاری از کاربران گفتند که GPT-5 نسبت به GPT-4o حس انسانی و دوستانه کمتری دارد. لحن مکالمات رسمیتر، خشکتر و حتی گاهی «عصبی» یا «مأمور اداری» توصیف شد. - ریشه احتمالی:
این تغییر میتواند ناشی از بازطراحی سیستم persona و style prompt داخلی مدل باشد تا برای استفاده سازمانی و تجاری ایمنتر شود. - پیامد:
این تغییر لحن، تجربه کاربر را بهویژه برای مکالمات خلاقانه یا نیازمند همدلی تضعیف کرد. برند ChatGPT تا حدی بر حس «همراه هوشمند» بنا شده بود، و این فاصله عاطفی باعث شد کاربران حس کنند با یک «ماشین بیروح» صحبت میکنند.
در این جدول، تفاوتهای GPT-4o و GPT-5 را براساس دو مشکل اصلی گزارششده توسط کاربران میبینی:
| ویژگی / مشکل | GPT-4o | GPT-5 | تحلیل اثر تغییر |
|---|---|---|---|
| طول و عمق پاسخها | تمایل به ارائه پاسخهای نسبتاً بلند، با جزئیات و مثالهای بیشتر—even در حالت پیشفرض. | پاسخها کوتاهتر، سادهتر و محافظهکارانهتر—even در پرسشهای تحلیلی. | بهینهسازی برای کاهش خطا باعث محافظهکاری بیش از حد شده و نیاز به درخواستهای پیدرپی را افزایش داده. |
| لحن و شخصیت مکالمه | لحن دوستانهتر، محاورهای و در برخی موارد شوخطبع؛ حس «همراه هوشمند». | لحن رسمیتر، خشکتر و گاهی «بیروح» یا «عصبی»؛ شبیه یک دستیار اداری. | احتمالاً برای استفاده سازمانی و ایمنی محتوایی تغییر کرده، اما باعث کاهش جذابیت برای کاربران عادی شده. |