blog
ادعای هواوی درباره مستقل بودن توسعه مدل Pangu Pro Moe
- لابراتوار «Noah Ark» هواوی اعلام کرد که مدل زبان بزرگ Pangu Pro Moe کاملاً مستقل توسعه یافته و هیچ گونه استخراج مستقیم یا “upcycling” از مدل رقیبی مانند Alibaba Qwen انجام نشده است. پس از انتشار مقالهای در GitHub توسط HonestAGI که به شباهتهای نامعمول اشاره کرده بود، هواوی این موضوع را تکذیب کرده است. هواوی همچنین اعلام کرده که Pangu Pro Moe اولین مدل بزرگ ساخته شده بر روی تراشههای داخلی Ascend بوده است.
تحلیل:
- رقابت جدی در بازار LLM چینیها: این واکنش نشانگر حساسیت شدید در مورد مالکیت معنوی و استقلال فنی در چین است و رقابت هواوی و علیبابا را برجستهتر میکند.
- تقویت اکوسیستم داخلی: ادعای استقلال نشاندهنده سرمایهگذاری قابل توجه هواوی در توسعه سختافزار (Ascend) و نرمافزار بومی است.
- جنبه حقوقی: این موضوع میتواند به تنشهای قانونی مرتبط با حقوق مالکیت معنوی و تطبیق با مجوزهای متنباز منجر شود.
- دنبالکنندگان این موضوع: جامعه توسعهدهندگان و مشتریان B2B هواوی در بخش دولت و بانکی.
۱. بررسی فنی ادعا و پاسخ هواوی
ادعای «اشتراک شدید الگوریتمی»
- در تاریخ ۴ ژوئیه ۲۰۲۵، گروه HonestAGI مستندی فنی منتشر کرد و اشاره کرد که پارامترهای «multi‑head attention» در مدل Pangu Pro Moe با نظم آماری ۰.۹۲۷ مشابهت قابل توجهی با مدل Qwen 2.۵‑14B دارد.
- این نتیجه نمایشدهنده “fingerprint” دو مدل است که به ادعای آنها بازتابی از استفاده از همان وزنها با تغییرات جزئی است.
واکنش رسمی هواوی
- Noah Ark Lab ادعا کرد مدل را کاملا مستقل ساختهاند؛ نه از Qwen استفاده شده و نه از مدلهای دیگر برای آموزش تدریجی (upcycling) کمک گرفتهاند.
- تأکید شد که معماری و ویژگیهای فنی در کد Pangu Pro Moe اختصاصی بوده و تمامی اجزای متنباز، مطابق مجوزها، درج شدهاند .
- اولین مدل بزرگ LLM ساختهشده بر روی تراشه «Ascend» هواوی معرفی و بهصورت متنباز در GitCode منتشر شده است.
۲. تحلیل گستردهتر
اهمیت استقلال فنی
- مستقل بودن در این زمینه یعنی:
- طراحی معماری از پایه (بدون طراحی از روی مدلهای دیگر مانند Qwen)
- آموزش کامل مدل از صفر (بدون تکیه بر weightهای ذخیرهشده)
- استفاده از زنجیره داخلی سختافزاری بهصورت end‑to‑end (مدل + آموزش + تراشه Ascend).
اهمیت سختافزاری
- یکی از نقاط قوت اصلی هواوی استفاده از تراشههای داخلی Ascend برای آموزش مدل MoE 72B است، نشاندهندهی درک عمیق این شرکت از همترازی سختافزار و نرمافزار.
۳. تأثیر این خبر بر دنیای هوش مصنوعی
- تقویت حاکمیت فناوری چین
- استقلال در توسعه AI باعث توانمندسازی شرکتهای داخلی برای پروژههای حساس ملی و تجاری بدون وابستگی به کشورهای غربی میشود.
- رقابت در بازار جهانی LLM
- هواوی با ایجاد مدل مستقل، به رقیب جدی برای Qwen، DeepSeek و GPT تبدیل میشود و نگاه جهانیان را به AI چینی جلب میکند.
- توسعه اکوسیستم متنباز / سختافزار داخلی
- انتشار متنباز Pangu و آموزش آن روی Ascend به توسعهدهندگان در داخل و خارج چین امکان میدهد بدون استفاده از تراشههای خارجی پروژه خود را اجرا کنند. این محرکی برای بازار AI مستقل جهانی است.
- بحث حقوق معنوی و اخلاق مدلسازی
- ادعاهای plagiarism باعث تشدید توجه به مسائل اخلاقی AI و شفافیت آموزش مدل میشود؛ نیاز به استانداردهای مورد پذیرش بینالمللی را یادآور میگردد .
نتیجهگیری
خبر ادعای استقلال Pangu Pro Moe و واکنش هواوی در برابر اتهامات plagiarism نقطه عطفی در توسعه AI چین است. هواوی با تکیه بر معماری اختصاصی، استفاده از تراشه Ascend و انتشار متنباز، نشان داده که در تلاش است زنجیره کامل توسعه LLM را در حوزه ملی کنترل کند.
این خبر برای جامعه AI جهانی پیامی شفاف دارد: توسعه LLM بدون اتکا به فناوری خارجی و با توجه به اصول مالکیت معنوی قابل تحقق است.
تحلیل جامع و دقیق مسیر توسعه مدل Pangu از ابتدای پروژه تا نسخههای پیشرفتهتر و نقش آن در صنعت
۱. مسیر توسعه Pangu – از آغاز تا متنبازسازی
الف. Pangu α و PanGu‑Σ (۲۰۲۱–۲۰۲۳)
- آوریل ۲۰۲۱: انتشار PanGu‑α با معماری Transformer و ۲۰۰ میلیارد پارامتر، تمرکز بر زبان چینی و کد و ساخت اولین LLM بزرگ چینی.
- آوریل ۲۰۲۳: معرفی PanGu‑Σ با بیش از ۱ تریلیون پارامتر، معماری ترکیبی MoE و افزاش قابل توجه در توانایی تحلیل چندرسانهای .
ب. PanGu 3.0 و ۵.۰ (۲۰۲۳–۲۰۲۴)
- ژوئیه ۲۰۲۳: عرضه PanGu ۳.۰ برای صنایع مثل دولت، معدن، و آبوهوا.
- ژوئن ۲۰۲۴: انتشار PanGu 5.0 با معماری سهسطحی (L0–L2)، شامل مدلهای NLP، CV، مولتیمدال، پیشبینی و محاسبات علمی.
ج. Pangu 5.5 و Pangu Pro MoE (2025)
- ژوئن ۲۰۲۵: معرفی Pangu 5.5 با ۷۱۸ میلیارد پارامتر، مدل MoE با ۲۵۶ اکسپرت، طراحی سریع و تحلیل عمیق و کاربرد در صنعت کشاورزی و تولید.
- Pangu Pro MoE: مدل ۷۲ میلیارد پارامتر پیادهسازیشده با معماری MoGE روی تراشه Ascend، بهرهوری بالا و متنباز شده در GitCode.
۲. کاربردها و اثربخشی Pangu در صنعت
کشاورزی
- دانشگاه کشاورزی چین با استفاده از Pangu، رقم برنجی با کاهش ۲۵٪ ارتفاع ولی حفظ عملکرد تولید کردهاند.
تولید و ساخت
- شرکتهای صنعتی مثل Conch Cement برای پیشبینی مقاومت کلینکر در چند روز آینده استفاده، که منجر به کاهش مصرف انرژی و بازیافت پسماند میشود .
- China Baowu Steel با مدل Blast Furnace توانسته نرخ ذوب بیش از ۹۰٪ را حفظ کرده و هر تن سوخت را ذخیره کند.
⚙️ معدن، انرژی، و برق
- Pangu در معادن برای تشخیص خطا استفاده میشود و در صنایع شیمیایی، برق و انرژیهای نو نیز کاربرد دارد .
تحقیقات علمی و آبوهوا
- مدل Pangu‑Weather در ECMWF استفاده میشود و ۱۰⁴ برابر سریعتر از روشهای سنتی است و دقت پیشبینی بسیار بالا دارد.
رباتیک و خودروهای هوشمند
- CloudRobo و Pangu World Model برای رباتهای embodied و نقشهبرداری در صنایع خودروسازی مانند GAC به کار گرفته میشود.
۳. نتیجهگیری و جایگاه Pangu
- مسیر Pangu از یک LLM عمومی تا نسخههای تخصصی صنعتی (۷۱۸B MoE) پیش رفته که نشان از تعهد هواوی به توسعه کاملا بومی و چندرسانهای دارد.
- نقش پررنگ در صنایع سنتی، کشاورزی هوشمند، انرژی و رباتیک، Pangu را از ابزار تحقیقاتی به نیروی محرک صنعتی تبدیل کرده.
- متنبازسازی Pangu Pro MoE و بومیسازی سختافزار Ascend این امکان را فراهم میکند که کشورهای دیگر نیز مستقل از اکوسیستم آمریکا به AI دسترسی داشته باشند.