هوش مصنوعی

ادعای هواوی درباره مستقل بودن توسعه مدل Pangu Pro Moe

  • لابراتوار «Noah Ark» هواوی اعلام کرد که مدل زبان بزرگ Pangu Pro Moe کاملاً مستقل توسعه یافته و هیچ گونه استخراج مستقیم یا “upcycling” از مدل رقیبی مانند Alibaba Qwen انجام نشده است. پس از انتشار مقاله‌ای در GitHub توسط HonestAGI که به شباهت‌های نامعمول اشاره کرده بود، هواوی این موضوع را تکذیب کرده است. هواوی همچنین اعلام کرده که Pangu Pro Moe اولین مدل بزرگ ساخته شده بر روی تراشه‌های داخلی Ascend بوده است.

تحلیل:

  • رقابت جدی در بازار LLM چینی‌ها: این واکنش نشانگر حساسیت شدید در مورد مالکیت معنوی و استقلال فنی در چین است و رقابت هواوی و علی‌بابا را برجسته‌تر می‌کند.
  • تقویت اکوسیستم داخلی: ادعای استقلال نشان‌دهنده سرمایه‌گذاری قابل توجه هواوی در توسعه سخت‌افزار (Ascend) و نرم‌افزار بومی است.
  • جنبه حقوقی: این موضوع می‌تواند به تنش‌های قانونی مرتبط با حقوق مالکیت معنوی و تطبیق با مجوزهای متن‌باز منجر شود.
  • دنبال‌کنندگان این موضوع: جامعه توسعه‌دهندگان و مشتریان B2B هواوی در بخش دولت و بانکی.

۱. بررسی فنی ادعا و پاسخ هواوی

ادعای «اشتراک شدید الگوریتمی»

  • در تاریخ ۴ ژوئیه ۲۰۲۵، گروه HonestAGI مستندی فنی منتشر کرد و اشاره کرد که پارامترهای «multi‑head attention» در مدل Pangu Pro Moe با نظم آماری ۰.۹۲۷ مشابهت قابل توجهی با مدل Qwen 2.۵‑14B دارد.
  • این نتیجه نمایش‌دهنده‌ “fingerprint” دو مدل است که به ادعای آنها بازتابی از استفاده از همان وزن‌ها با تغییرات جزئی است.

واکنش رسمی هواوی

  • Noah Ark Lab ادعا کرد مدل را کاملا مستقل ساخته‌اند؛ نه از Qwen استفاده شده و نه از مدل‌های دیگر برای آموزش تدریجی (upcycling) کمک گرفته‌اند.
  • تأکید شد که معماری و ویژگی‌های فنی در کد Pangu Pro Moe اختصاصی بوده و تمامی اجزای متن‌باز، مطابق مجوزها، درج شده‌اند .
  • اولین مدل بزرگ LLM ساخته‌شده بر روی تراشه‌ «Ascend» هواوی معرفی و به‌صورت متن‌باز در GitCode منتشر شده است.

۲. تحلیل گسترده‌تر

اهمیت استقلال فنی

  • مستقل بودن در این زمینه یعنی:
    1. طراحی معماری از پایه (بدون طراحی از روی مدل‌های دیگر مانند Qwen)
    2. آموزش کامل مدل از صفر (بدون تکیه بر weightهای ذخیره‌شده)
    3. استفاده از زنجیره داخلی سخت‌افزاری به‌صورت end‑to‑end (مدل + آموزش + تراشه Ascend).

اهمیت سخت‌افزاری


۳. تأثیر این خبر بر دنیای هوش مصنوعی

  1. تقویت حاکمیت فناوری چین
    • استقلال در توسعه AI باعث توانمندسازی شرکت‌های داخلی برای پروژه‌های حساس ملی و تجاری بدون وابستگی به کشورهای غربی می‌شود.
  2. رقابت در بازار جهانی LLM
    • هواوی با ایجاد مدل مستقل، به رقیب جدی برای Qwen، DeepSeek و GPT تبدیل می‌شود و نگاه جهانیان را به AI چینی جلب می‌کند.
  3. توسعه اکوسیستم متن‌باز / سخت‌افزار داخلی
    • انتشار متن‌باز Pangu و آموزش آن روی Ascend به توسعه‌دهندگان در داخل و خارج چین امکان می‌دهد بدون استفاده از تراشه‌های خارجی پروژه خود را اجرا کنند. این محرکی برای بازار AI مستقل جهانی است.
  4. بحث حقوق معنوی و اخلاق مدل‌سازی
    • ادعاهای plagiarism باعث تشدید توجه به مسائل اخلاقی AI و شفافیت آموزش مدل می‌شود؛ نیاز به استانداردهای مورد پذیرش بین‌المللی را یادآور می‌گردد .

نتیجه‌گیری

خبر ادعای استقلال Pangu Pro Moe و واکنش هواوی در برابر اتهامات plagiarism نقطه عطفی در توسعه AI چین است. هواوی با تکیه بر معماری اختصاصی، استفاده از تراشه Ascend و انتشار متن‌باز، نشان داده که در تلاش است زنجیره کامل توسعه LLM را در حوزه ملی کنترل کند.
این خبر برای جامعه AI جهانی پیامی شفاف دارد: توسعه LLM بدون اتکا به فناوری خارجی و با توجه به اصول مالکیت معنوی قابل تحقق است.

تحلیل جامع و دقیق مسیر توسعه مدل Pangu از ابتدای پروژه تا نسخه‌های پیشرفته‌تر و نقش آن در صنعت

۱. مسیر توسعه Pangu – از آغاز تا متن‌بازسازی

الف. Pangu α و PanGu‑Σ (۲۰۲۱–۲۰۲۳)

  • آوریل ۲۰۲۱: انتشار PanGu‑α با معماری Transformer و ۲۰۰ میلیارد پارامتر، تمرکز بر زبان چینی و کد و ساخت اولین LLM بزرگ چینی.
  • آوریل ۲۰۲۳: معرفی PanGu‑Σ با بیش از ۱ تریلیون پارامتر، معماری ترکیبی MoE و افزاش قابل توجه در توانایی تحلیل چندرسانه‌ای .

ب. PanGu 3.0 و ۵.۰ (۲۰۲۳–۲۰۲۴)

  • ژوئیه ۲۰۲۳: عرضه PanGu ۳.۰ برای صنایع مثل دولت، معدن، و آب‌وهوا.
  • ژوئن ۲۰۲۴: انتشار PanGu 5.0 با معماری سه‌سطحی (L0–L2)، شامل مدل‌های NLP، CV، مولتی‌مدال، پیش‌بینی و محاسبات علمی.

ج. Pangu 5.5 و Pangu Pro MoE (2025)

  • ژوئن ۲۰۲۵: معرفی Pangu 5.5 با ۷۱۸ میلیارد پارامتر، مدل MoE با ۲۵۶ اکسپرت، طراحی سریع و تحلیل عمیق و کاربرد در صنعت کشاورزی و تولید.
  • Pangu Pro MoE: مدل ۷۲ میلیارد پارامتر پیاده‌سازی‌شده با معماری MoGE روی تراشه Ascend، بهره‌وری بالا و متن‌باز شده در GitCode.

۲. کاربردها و اثربخشی Pangu در صنعت

کشاورزی

تولید و ساخت

  • شرکت‌های صنعتی مثل Conch Cement برای پیش‌بینی مقاومت کلینکر در چند روز آینده استفاده، که منجر به کاهش مصرف انرژی و بازیافت پسماند می‌شود .
  • China Baowu Steel با مدل Blast Furnace توانسته نرخ ذوب بیش از ۹۰٪ را حفظ کرده و هر تن سوخت را ذخیره کند.

⚙️ معدن، انرژی، و برق

  • Pangu در معادن برای تشخیص خطا استفاده می‌شود و در صنایع شیمیایی، برق و انرژی‌های نو نیز کاربرد دارد .

تحقیقات علمی و آب‌وهوا

  • مدل Pangu‑Weather در ECMWF استفاده می‌شود و ۱۰⁴ برابر سریع‌تر از روش‌های سنتی است و دقت پیش‌بینی بسیار بالا دارد.

رباتیک و خودروهای هوشمند

  • CloudRobo و Pangu World Model برای ربات‌های embodied و نقشه‌برداری در صنایع خودروسازی مانند GAC به کار گرفته می‌شود.

۳. نتیجه‌گیری و جایگاه Pangu

  • مسیر Pangu از یک LLM عمومی تا نسخه‌های تخصصی صنعتی (۷۱۸B MoE) پیش رفته که نشان از تعهد هواوی به توسعه کاملا بومی و چندرسانه‌ای دارد.
  • نقش پررنگ در صنایع سنتی، ‌کشاورزی هوشمند، انرژی و رباتیک، Pangu را از ابزار تحقیقاتی به نیروی محرک صنعتی تبدیل کرده.
  • متن‌بازسازی Pangu Pro MoE و بومی‌سازی سخت‌افزار Ascend این امکان را فراهم می‌کند که کشورهای دیگر نیز مستقل از اکوسیستم آمریکا به AI دسترسی داشته باشند.
به این مطلب امتیاز دهید:
تعداد رأی‌دهندگان: ۷ میانگین امتیاز: ۵

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *