تطلق Cartesia نماذج Sonic-3.5 لتحويل النص إلى كلام وInk-2 للتعرّف على الكلام إلى نص للذكاء الاصطناعي الصوتي في الوقت الفعلي

S%1.25-
SONIC%1.77-
وفقًا لـ Beating، أعلنت شركة Cartesia، وهي شركة ناشئة في مجال أصوات تعمل بالذكاء الاصطناعي، إطلاق Sonic-3.5 وInk-2، لتشكيل حزمة تقنية موحدة لعامل صوتي يعمل في الوقت الفعلي. يتولى Sonic-3.5 تحويل النص إلى كلام مع زمن كمون لأول رمز يبلغ 90 مللي ثانية، ويدعم 42 لغة. يوفّر Ink-2 تحويل الكلام إلى نص بمعدل خطأ في الكلمات يبلغ 3.6%، مع اكتشاف التحولات الأصلي عبر الاستدلال الدلالي بدلًا من مدة الصمت وحدها. يندمج النموذجان عبر واجهة برمجة تطبيق واحدة مع بث ثنائي الاتجاه لتقليل تأخيرات الإرسال.
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات