Google تطلق Gemini 3.1 Flash TTS مع تعبير عاطفي محسّن وقدرات تعدد المتحدثين

رسالة Gate News، 17 أبريل — كشفت Google النقاب عن Gemini 3.1 Flash TTS، وهو نموذج متقدم لتحويل النص إلى كلام مع ميزات محسنة للتعبير العاطفي والتحكم، في 15 أبريل. سيتم طرح النموذج الجديد تدريجيًا عبر واجهات برمجة التطبيقات للمطورين، وVertex AI الخاص بالمؤسسات، وأدوات التعاون.

تشمل القدرات الأساسية للنموذج وسومًا صوتية تعتمد على اللغة الطبيعية لضبط السرعة والتنغيم والعاطفة بدقة، إلى جانب “Director Mode” لتحديد المشاهد وأدوار الشخصيات من أجل توليد مخرجات صوتية أكثر دقة. تُمكّن ميزة تعدد المتحدثين من توليد الحوار بشكل متزامن، ما يسمح بتدفقات محادثة أكثر طبيعية ومناسبـة للبودكاست والمحتوى الصوتي ومساعدي الذكاء الاصطناعي. يدعم النموذج أكثر من 70 لغة ولهجة، ما يعكس اللهجات والتعبيرات الإقليمية لتجارب صوتية مخصصة عالميًا.

أكدت Google على الأداء وكفاءة التكلفة، محققة نتائج مرتفعة على معايير تقييم البشر العمياء مع تقليل التكاليف الحاسوبية عبر بنية Flash—المصممة لاعتماد المؤسسات على نطاق واسع. يتضمن الصوت المُولَّد ترميزًا مائيًا SynthID لتحديد المحتوى المُولَّد بالذكاء الاصطناعي ومكافحة المعلومات المضللة.

تعكس هذه الخطوة اشتداد المنافسة في واجهات الصوت. تقوم OpenAI بدمج ميزات الصوت في الوقت الفعلي مع الذكاء الاصطناعي الحواري من أجل تفاعلات شبيهة بالبشر، بينما توسع Meta استثماراتها في شخصيات الذكاء الاصطناعي مع تجارب اجتماعية قائمة على الصوت. يلاحظ مراقبون في الصناعة أنه بينما قد يبقى مستوى عالٍ من التمثيل والعمل الإبداعي مدفوعًا بالبشر في الوقت الحالي، قد يشهد سوق الإنتاج المتكرر وعلى نطاق واسع تبنّيًا تدريجيًا للذكاء الاصطناعي في مجالات الدبلجة والإعلانات وسلاسل الكتب الصوتية.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

الصين تعزز الإطار التشريعي للذكاء الاصطناعي والاقتصاد الرقمي وسلسلة الكتل

تخطط الصين لتعزيز نظامها القانوني للشبكات لتلبية احتياجات تطوير الإنترنت، مع التركيز على التشريعات الخاصة بالذكاء الاصطناعي والاقتصاد الرقمي وقطاعات تقنية أخرى. بحلول ديسمبر 2025، يُتوقع إصدار أكثر من 180 قانونًا، رغم أن اللوائح الحالية ما زالت متأخرة عن توقعات الجمهور.

GateNewsمنذ 15 د

Intchains 集团披露已质押 8,040 ETH,加速基于 AI 的运营转型

Intchains 集团披露其累计质押 8,040 ETH,采用的策略包括 FalconX 平台以及其自有 Goldshell Stake。该公司也正在通过 AI 自动化来增强运营,以提升效率和决策能力。

GateNewsمنذ 45 د

فيترين؟ جاي تشو يربحون أكثر؟ شركة إدارة GD تجتمع سرًا مع العائلة المالكة في دبي لمناقشة الاكتتاب العام والذكاء الاصطناعي والروبوتات

شركة تكنولوجيا الترفيه في كوريا Galaxy Corporation دخلت مؤخرًا إلى سوق الشرق الأوسط، وأنشأت كيانًا قانونيًا في دبي باسم «Galaxy ME»، والتقت مع أفراد من العائلة المالكة في الإمارات العربية المتحدة لاستكشاف تكامل الذكاء الاصطناعي والمحتوى. وقد اختارت الشركة وسيطًا ماليًا لإجراء الطرح الأولي للاكتتاب (IPO)، وبلغت إيراداتها في العام الماضي 3000 مليار وون كوري، كما اجتذبت استثمارات من جاي تشو (周杰倫) وآداتا (威剛) وغيرها. تهدف هذه الخطة إلى دفع تطور نظام الترفيه في الشرق الأوسط، مع التأكيد على أهمية استراتيجيتها العالمية.

ChainNewsAbmediaمنذ 2 س

فريق صيني، EvoMap يثور على نسخة Hermes Agent المقلّدة المنتشرة فجأة: يوجد تشابه كبير بين أنظمة التطور الذاتي

فريق صيني يدّعى EvoMap يوجّه اتهامات إلى وكيل Hermes التابع لشركة Nous Research بأنه قام بنسخ بنيته الخاصة Evolver/GEP، معتبرًا أن الاثنين يشتركان في درجة عالية من التشابه عبر عدة وحدات رئيسية. يشير EvoMap إلى أن تصميم Hermes لم يستشهد أو يقدّم شكرًا لمحتواه المنشور سابقًا، وقد أثار هذا الجدل اهتمامًا واسعًا من المجتمع؛ إذ أبدى بعض المستخدمين الصينيين على الإنترنت دعمًا لـ EvoMap، وانتقدوا سلوك النسخ المنسوب إلى Hermes. ورغم أن فريق أبحاث Nous لم يرد بعد على الاتهامات بندًا بندًا، فقد انتشر الحدث بسرعة في النقاشات الدائرة حول الذكاء الاصطناعي.

ChainNewsAbmediaمنذ 2 س

محبّذ لدى المستثمرين الأوائل في OpenAI! شركة ناشئة لواجهات الدماغ والكمبيوتر Sabi ستُسرّع التسليم بحلول نهاية العام «الكتابة بالthoughts» قبعة صوفية

يعلن كل من شركة Sabi الناشئة من وادي السيليكون أنها تعمل على تطوير واجهة دماغ-حاسوب قابلة للارتداء دون الحاجة إلى تدخل جراحي اختراقي، حيث يمكن للمستخدمين إدخال النص على الشاشة بمجرد “التفكير”، مع توقع طرحها في أواخر عام 2026. سيحتوي هذا الجهاز على ما يصل إلى 100,000 من أجهزة الاستشعار الدقيقة، بما يساعد على تفسير نشاط الدماغ بدقة، كما تؤكد Sabi أيضًا حماية خصوصية البيانات.

ChainNewsAbmediaمنذ 2 س

كشف تسريب البيانات أن "كلود" قد لا يكون ذكيًا بشكل كافٍ، وأن ذلك ليس مجرد قصة شائعة في المدينة، فالنماذج الذكية غير مستقرة وتشكل مخاطر على الشركات

يتناول المقال ظاهرة عدم استقرار أداء نماذج LLM (النماذج اللغوية الكبيرة) في تطبيقات الشركات للذكاء الاصطناعي، ويطلق عليها اسم «خفض القدرات»، ويقدم أمثلة توضح تأثيرها الفعلي على سير عمل الشركات. تُظهر البيانات أن أغلب النماذج السائدة تقع في حالة تراجع، ما يؤثر على إنتاجية الشركات واستقرارها، ويجب على الشركات البدء في إيلاء اهتمام لاستقرار النموذج بوصفه معيارًا جديدًا، وإلا فإنها ستواجه مخاطر على البنية التحتية.

ChainNewsAbmediaمنذ 3 س
تعليق
0/400
لا توجد تعليقات