Cartesia lance les modèles TTS Sonic-3,5 et STT Ink-2 pour une IA vocale en temps réel

S-1,25%
SONIC-1,77%
D’après Beating, la startup de voix IA Cartesia a annoncé le lancement de Sonic-3.5 et Ink-2, formant une pile technologique unifiée d’agent vocal temps réel. Sonic-3.5 gère la synthèse vocale (text-to-speech) avec une latence de 90 millisecondes pour le premier token et prend en charge 42 langues. Ink-2 fournit la reconnaissance vocale (speech-to-text) avec un taux d’erreur de mots de 3,6 % et une détection native des tours basée sur une compréhension sémantique plutôt que sur la durée du silence seule. Les deux modèles s’intègrent via une seule API avec un streaming bidirectionnel afin de réduire les délais de transmission.
Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire