xAI تطلق الإصدار التجريبي من Voice Agent Builder، وGrok Voice يتفوق على GPT في الاختبارات المعيارية

XAI%4.59
GROK%1.48-

أعلنت xAI في 1 يوليو عن إطلاق النسخة التجريبية من Voice Agent Builder، وهي منصة لبناء وكلاء صوتيين بالذكاء الاصطناعي بدون أي كود برمجي، تتيح للمستخدمين بناء وكيل صوتي على مستوى المؤسسات في دقيقتين باستخدام مطالبات اللغة الطبيعية؛ تستخدم المنصة مسارًا صوتيًا واحدًا من الكلام إلى الكلام (Speech-to-Speech) مقترنًا بإحكام مع Grok Voice، وتتفوق في الاختبارات المعيارية على GPT.

اختبار τ-voice Bench المعياري: Grok Voice Think Fast 1.0 تتفوق على GPT

xAI AI語音代理建置平台 (المصدر: موقع xAI)

وفقًا للإعلان الرسمي من xAI، احتل Grok Voice Think Fast 1.0 المرتبة الأولى في قائمة اختبارات τ-voice Bench الصوتية المعيارية، متجاوزًا Google Gemini 3.1 Flash Live وOpenAI GPT Realtime 1.5 في مؤشري سرعة الاستجابة والقدرة على الاستدلال.

أوضحت xAI أن Grok Voice تم تدريبه باستخدام سيناريوهات مكالمات حقيقية مصممة لتكون "الأصعب"، تغطي ضوضاء الهاتف منخفضة الجودة، واللهجات القوية، ومقاطعة المستخدم، والتعليمات الغامضة، ويدعم بشكل أصلي أكثر من 25 لغة.

بنية الكلام إلى الكلام من طرف إلى طرف: مسار صوتي واحد يحل محل البنية التقليدية STT+LLM+TTS المجمعة

أوضحت xAI رسميًا أن خدمة العملاء الصوتية التقليدية بالذكاء الاصطناعي تحتاج إلى ربط ثلاثة أنظمة مستقلة: تحويل الكلام إلى نص (STT)، ونموذج اللغة الكبير (LLM)، وتحويل النص إلى كلام (TTS). يزيد هذا البنية المجمعة من زمن الوصول متعدد القفزات، ويرفع معدل الأخطاء وتكاليف التشغيل.

يستخدم Voice Agent Builder مسارًا صوتيًا واحدًا من الكلام إلى الكلام من طرف إلى طرف مقترنًا بإحكام مع Grok Voice، دون تقسيم أو تبديل المراحل في عملية معالجة الصوت، بهدف تقليل زمن الوصول وتقليل أخطاء الربط.

قاعدة المعرفة، أدوات الربط، استنساخ الصوت، والاتصال الهاتفي: أربع مواصفات وظيفية أساسية

وفقًا لوصف الوظائف الرسمي من xAI، فإن مواصفات الوحدات الوظيفية الأساسية الأربع لـ Voice Agent Builder هي كما يلي:

قاعدة المعرفة (Knowledge Base): تدعم تحميل تنسيقات Word وExcel وPDF وJSON وغيرها، ويمكن تنظيمها في مجموعات Collections مشتركة عبر الوكلاء لضمان اتساق مواصفات المنتج والسياسات.

أدوات الربط (Tools & Connectors): مدمجة مع تقويم Google/Outlook، والبحث على الويب، والبحث على X (Twitter)، وNotion؛ تدعم تحويل المكالمة إلى وكيل بشري، وإنهاء المكالمة، وإشعار الفريق الفوري.

الصوت والهاتف (Voice & Telephony): يوفر أكثر من 80 صوتًا مدمجًا؛ يدعم استنساخ الصوت للعلامة التجارية باستخدام دقيقتين فقط من الصوت؛ يمكن الحصول على رقم هاتف مجاني من xAI، أو ربط نظام الهاتف الحالي عبر SIP.

التسعير الشفاف (Pricing): رسوم API للحوسبة تبلغ 0.05 دولار للدقيقة، بدون رسوم منصة إضافية؛ عند استخدام رقم هاتف توفره xAI، تفرض رسوم اتصال إضافية بقيمة 0.01 دولار للدقيقة.

آليات الأمان المؤسسي: التسجيل التلقائي والنص الحرفي، سجل استخدام الأدوات، وتعيين حدود المحادثة

وفقًا للإعلان الرسمي من xAI، يحتوي Voice Agent Builder على آليات مراقبة (Observability) ودرابزين أمان (Guardrails) مدمجة للمستخدمين على مستوى المؤسسات: تسجيل تلقائي لكل مكالمة وإنشاء نص حرفي؛ يمكن للمسؤولين عرض سجل الأدوات التي استخدمها الذكاء الاصطناعي أثناء المكالمة في أي وقت؛ ويمكن تعيين حدود صارمة للمحادثة، مثل منع الذكاء الاصطناعي من قراءة أرقام بطاقات الائتمان الخاصة بالعملاء، أو منع مناقشة مواضيع سياسية خارجة عن الموضوع مع المستخدم.

وقالت xAI في إعلانها الرسمي: "الحكم بالأذن أدق من النظر إلى الاختبارات المعيارية — ابنِ وكيلًا، واتصل بأصعب سير عمل لديك وجرّبه."

الأسئلة الشائعة

ما هي رسوم الحوسبة لـ xAI Voice Agent Builder؟

وفقًا للإعلان الرسمي من xAI، رسوم API للحوسبة هي 0.05 دولار للدقيقة، بدون رسوم منصة إضافية؛ إذا تم استخدام رقم الهاتف المجاني الذي توفره xAI، فإن رسوم الاتصال الإضافية هي 0.01 دولار للدقيقة.

كيف كان أداء Grok Voice Think Fast 1.0 في اختبار τ-voice Bench؟

وفقًا للإعلان الرسمي من xAI، تفوق Grok Voice Think Fast 1.0 في اختبار τ-voice Bench المعياري على Google Gemini 3.1 Flash Live وOpenAI GPT Realtime 1.5، محتلاً المرتبة الأولى في مؤشري سرعة الاستجابة والقدرة على الاستدلال.

أين يمكن تجربة xAI Voice Agent Builder حاليًا؟

وفقًا للإعلان الرسمي من xAI، النسخة التجريبية من Voice Agent Builder متاحة الآن على xAI Console للاختبار.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات