مؤخرا، تصدر نموذج العالم المتجسد WoW الذي تم تطويره في مركز الابتكار للروبوتات الشبيهة بالبشر في بكين في قائمة تقييم WorldArena Challenge Track 2 (Data Engine). في تقييمات الذكاء الاصطناعي العالمية التي شاركت فيها أفضل الجامعات المحلية والدولية، وصل "دماغ الروبوت" القادم من يي تشوانغ ببكين مستوى رائدا في الصناعة في القدرة الأساسية على "فهم العالم الفيزيائي الحقيقي وتوليد البيانات".

(الصورة من VCG)
WorldArena هي أول منصة معيارية موحدة لتقييم مدى فعالية الإدراك والوظائف لنموذج العالم المتجسد بشكل شامل، وقد تم إطلاقها بالتعاون بين جامعة تسينغهوا، وجامعة بكين، وجامعة شانغهاي جياو تونغ، وجامعة برينستون وغيرها من الجامعات. في مسابقة التحدي WorldArena، يركز الأداء الاختباري العملي في Track 2 (Data Engine) بشكل رئيسي على ما إذا كانت البيانات الاصطناعية التي ينتجها النموذج يمكن أن تعزز فعلاً من فعالية تدريب استراتيجيات الروبوتات في الأسفل.
يمكن لنموذج العالم المتجسد WoW أن يوفر للروبوتات "عقلا" قادرا على فهم وتوقع القوانين الفيزيائية، ويمكنه محاكاة القوانين الفيزيائية الحقيقية، كما يمكنه توليد بيانات تفاعلية عالية الجودة ومتوافقة مع المنطق الفيزيائي بشكل مستقل، مما يحل مشكلة نقص البيانات في صناعة الذكاء المتجسد. النموذج الذي حقق المركز الأول هو النموذج الأصغر حجما في سلسلة WoW، وهو نموذج 1.3B. بدوره كـ "لاعب خفيف الوزن"، فإن أداء WoW 1.3B يتجاوز العديد من النماذج العامة الأكبر حجما والنماذج الجسدية المتخصصة.
على المستوى التقني، حقق نموذج WoW اختراقات في ثلاثة مجالات، حيث يمتلك قدرة توليد على مستوى محرك الفيزياء، ويمكنه تعلم مسارات تفاعل الروبوتات وإعادة تمثيل المشاهد المستقبلية بدقة؛ من خلال نموذج SOPHIA الذاتي الفريد، ويتم تشكيل حلقة بيانات "التطور الذاتي"، مما يمكنه من اشتقاق ملايين البيانات التفاعلية عالية الجودة من عدد قليل من المسارات الحقيقية؛ كما يمكنه تحقيق استدلال مغلق "من الصورة إلى الحركة"، مما يعادل تزويد الخوارزمية بـ "يدين" تلمسان العالم الحقيقي. البيانات التي يولدها WoW تتفوق بشكل ملحوظ على النماذج الأساسية الرائدة محليًا ودوليًا في تجارب دفع الروبوتات لإكمال مهام متنوعة مثل الالتقاط، ووضع الأشياء، والمهام طويلة المدى.
(المصدر: صحيفة يي تشنغ)