أطلقت Thinking Machines نموذج التفاعل باستجابة تبلغ 200 مللي ثانية، وتتفوق على GPT-Realtime-2.0

وفقاً لـ Beating وThinking Machines، وهي المختبر الذي أسسته مايرا موراتي، كبير مسؤولي التكنولوجيا السابق لدى OpenAI، أطلق المختبر نسخة بحثية تجريبية من نموذج Interaction، يتضمن معالجة صوت وفيديو في الوقت الفعلي بشكل أصلي، مع استجابات دقيقة تفصلها 200 مللي ثانية. يتيح النموذج الاستماع والمشاهدة والتحدث في الوقت نفسه، مع دعم مقاطعات المستخدم الفورية.

يستخدم نموذج TML-Interaction-Small بنية MoE تضم 276 مليار معلمة، مع تفعيل 12 مليار معلمة لكل استدلال. تُظهر بيانات رسمية تأخر تبديل أدوار الكلام البالغ 0.40 ثانية، ودرجة FD-bench V1.5 البالغة 77.8، وكلاهما يتجاوز GPT-Realtime-2.0 وGemini 3.1 Flash Live. من المقرر إتاحة وصول محدود للمعاينة خلال الأشهر المقبلة.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات