Cartesia lança modelos Sonic-3.5 TTS e Ink-2 STT para IA de voz em tempo real

S-1,25%
SONIC-1,77%
De acordo com Beating, a startup de voz com IA Cartesia anunciou o lançamento do Sonic-3.5 e do Ink-2, formando uma pilha unificada de tecnologia de agentes de voz em tempo real. O Sonic-3.5 faz conversão de texto para fala com latência de 90 milissegundos para o primeiro token e oferece suporte a 42 idiomas. O Ink-2 entrega reconhecimento de fala para texto com taxa de erro de palavras de 3,6% e detecção nativa de turnos baseada em compreensão semântica, em vez de considerar apenas a duração do silêncio. Ambos os modelos se integram por meio de uma única API com streaming bidirecional para minimizar atrasos na transmissão.
Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários