آرشیو برچسبها: VLM (Vision-Language Model)
شرکت Skild AI ادعا میکند که یک «مغز ربات همهکاره» توسعه داده است.
Skild AI، استارتآپی که روی هوش مصنوعی رباتیک تمرکز دارد (تأسیسشده توسط کهنهکاران از OpenAI و Google)، مدل OmniGibson را معرفی کرده. این مدل بر پایه یک Vision-Language Model (VLM) ساخته شده و از دادههای شبیهسازیشده گسترده (با استفاده از Gibson محیط) آموزش دیده تا رباتها را قادر سازد وظایف پیچیده را در محیطهای متنوع انجام دهند. ادعای اصلی: OmniGibson "همهکاره" است، یعنی مهارتها را بین رباتهای مختلف (مانند بازوی Franka، ربات دوپا یا حتی رباتهای خیالی) منتقل میکند.
Gemini Robotics 1.5 عوامل هوش مصنوعی را وارد دنیای فیزیکی میکند
این مدلها گام مهمی در ادغام هوش مصنوعی با رباتیک فیزیکی هستند و هدفشان ایجاد رباتهای هوشمند و همهمنظوره است که بتوانند وظایف پیچیده چندمرحلهای را در دنیای واقعی حل کنند. من این خبر را بر اساس محتوای لینک ارائهشده (که استخراج کامل آن را انجام دادم) تحلیل میکنم. تحلیل را به صورت ساختاریافته و با جزئیات پیش میبرم، از جمله قابلیتها، عملکرد، ایمنی و اهمیت کلی.