Cartesia bringt Sonic-3,5 TTS- und Ink-2 STT-Modelle für Echtzeit-Voice-KI auf den Markt

S-2,29%
SONIC-0,35%
Laut Beating hat der KI-Sprach-Startup Cartesia die Einführung von Sonic-3.5 und Ink-2 angekündigt und damit einen einheitlichen Technologie-Stack für Echtzeit-Sprachagenten gebildet. Sonic-3.5 übernimmt Text-to-Speech mit einer First-Token-Latenz von 90 Millisekunden und unterstützt 42 Sprachen. Ink-2 liefert Speech-to-Text mit einer Wortfehlerrate von 3,6% und nativer Turn-Erkennung auf Basis des semantischen Verständnisses statt nur der Dauer der Stille. Beide Modelle lassen sich über eine einzige API mit bidirektionalem Streaming integrieren, um Übertragungsverzögerungen zu minimieren.
Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare