VLM (Vision-Language Model) Archives

آرشیو برچسب‌ها: VLM (Vision-Language Model)

شرکت Skild AI ادعا می‌کند که یک «مغز ربات همه‌کاره» توسعه داده است.

ارسال شده توسط امیر متفکر

21 بهمن, 1404

Skild AI، استارت‌آپی که روی هوش مصنوعی رباتیک تمرکز دارد (تأسیس‌شده توسط کهنه‌کاران از OpenAI و Google)، مدل OmniGibson را معرفی کرده. این مدل بر پایه یک Vision-Language Model (VLM) ساخته شده و از داده‌های شبیه‌سازی‌شده گسترده (با استفاده از Gibson محیط) آموزش دیده تا ربات‌ها را قادر سازد وظایف پیچیده را در محیط‌های متنوع انجام دهند. ادعای اصلی: OmniGibson "همه‌کاره" است، یعنی مهارت‌ها را بین ربات‌های مختلف (مانند بازوی Franka، ربات دوپا یا حتی ربات‌های خیالی) منتقل می‌کند.

ادامه مطلب

رباتیک, هوش مصنوعی

Gemini Robotics 1.5 عوامل هوش مصنوعی را وارد دنیای فیزیکی می‌کند

ارسال شده توسط امیر متفکر

21 بهمن, 1404

این مدل‌ها گام مهمی در ادغام هوش مصنوعی با رباتیک فیزیکی هستند و هدفشان ایجاد ربات‌های هوشمند و همه‌منظوره است که بتوانند وظایف پیچیده چندمرحله‌ای را در دنیای واقعی حل کنند. من این خبر را بر اساس محتوای لینک ارائه‌شده (که استخراج کامل آن را انجام دادم) تحلیل می‌کنم. تحلیل را به صورت ساختاریافته و با جزئیات پیش می‌برم، از جمله قابلیت‌ها، عملکرد، ایمنی و اهمیت کلی.

ادامه مطلب