Meta AI تطلق نموذج العالم التنبئي المدمج المشترك للتخطيط الفيزيائي JEPA-WMs

رسالة أخبار ME، 3 أبريل (UTC+8)، نشرت فرق Meta AI Research نموذجًا لصور التنبؤ بالعالم القائم على نمط JEPA-WMs للتخطيط الفيزيائي وأبحاثه ذات الصلة. تستكشف هذه الدراسة العوامل الرئيسية لنجاح النموذج، وتوفر تنفيذًا كاملًا باستخدام PyTorch ومجموعة بيانات ونماذج مُدربة مسبقًا. تتضمن النماذج المنشورة النموذج الأساسي JEPA-WM، بالإضافة إلى نموذجَي DINO-WM وV-JEPA-2-AC(fixed) كخطّ أساس، وتغطي بيئات متعددة لعمليات الروبوت والتنقل مثل DROID & RoboCasa وMetaworld وPush-T وPointMaze وWall. يستخدم النموذج مُشفِّرات بصرية مثل DINOv3 ViT-L/16 وDINOv2 ViT-S/14 وV-JEPA-2 ViT-G/16، وتكون دقة إدخال الصور بشكل أساسي 224×224 أو 256×256. كما يوفّر المشروع رأس فك ترميز اختياري لوحدة VM2M للتصور وفك التتبعات، لكنه يؤكد أن هذا الرأس ليس ضروريًا لتدريب نماذج العالم أو لإجراء تقييمات التخطيط. جرى إتاحة جميع الموارد علنًا على GitHub وHugging Face وarXiv. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.28Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.22Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.49Kعدد الحائزين:3
    1.98%
  • القيمة السوقية:$2.21Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:2
    0.15%
  • تثبيت