Together AI Lanza Plataforma de Agente de Voz Con Latencia Inferior a 700ms

Lawrence Jengar

13 de marzo de 2026 01:57

Together AI presenta una infraestructura unificada de agentes de voz con integraciones de Deepgram y Cartesia, dirigida a implementaciones empresariales con una latencia de extremo a extremo por debajo de 700 ms.

Together AI lanzó una plataforma unificada de agentes de voz que mantiene el procesamiento de reconocimiento de voz a texto, modelos de lenguaje y texto a voz en el mismo clúster de infraestructura. La startup de IA en la nube, valorada en 3.300 millones de dólares, afirma que la configuración ofrece una latencia de extremo a extremo inferior a 700 milisegundos, lo suficientemente rápida para un flujo de conversación natural.

La plataforma se integra de forma nativa con Deepgram para transcripción y con Cartesia para síntesis de voz, ambos funcionando en los servidores co-localizados de Together en lugar de transmitir audio entre múltiples proveedores de la nube.

Por qué la co-ubicación es importante para la voz

La mayoría de los sistemas de voz en producción combinan diferentes proveedores para cada etapa del proceso. El audio pasa por un proveedor para la transcripción, luego se dirige a otro para la respuesta del modelo de lenguaje, y después a un tercero para la síntesis de voz. Cada transferencia añade latencia de red y puntos de fallo.

La propuesta de Together: mantener todo en el mismo centro de datos. La compañía reporta una latencia inferior a 500 ms en condiciones óptimas, aunque la cifra de 700 ms representa su límite declarado para el procesamiento de extremo a extremo.

“Los agentes de voz dependen de la latencia, y cada salto en la red entre proveedores es un punto donde la experiencia puede fallar,” dijo Abe Pursell, vicepresidente de asociaciones de Deepgram.

Flexibilidad en modelos sin parches

La plataforma soporta Whisper Large v3, Minimax Speech 2.6 Turbo, Rime Arcana y Kokoro, además del catálogo completo de modelos de lenguaje de Together. Los desarrolladores pueden intercambiar componentes sin reconstruir integraciones, lo cual es útil para equipos que prueban diferentes características de voz o precisión de transcripción para casos específicos.

Cartesia aporta sus modelos TTS Sonic-3 y Sonic-2 a la plataforma. Deepgram contribuye con Nova-3, Nova-3 Multilingual para transcripción, Flux para reconocimiento de voz conversacional y Aura-2 para síntesis.

A diferencia de los sistemas opacos de voz a voz, el enfoque modular de Together mantiene el acceso a transcripciones intermedias y textos de respuesta. Los equipos pueden inspeccionar, modificar y enrutar datos en medio del proceso, un requisito para muchos flujos de trabajo de cumplimiento empresarial.

Requisitos empresariales y uso en producción

La plataforma está dirigida a industrias reguladas con opciones de retención de datos cero, certificación SOC 2 Tipo II, cumplimiento HIPAA y residencia de datos dedicada. Decagon, que opera agentes de voz para soporte al cliente en facturación y resolución de problemas técnicos, ya funciona sobre esta infraestructura.

Together AI recaudó 305 millones de dólares en febrero de 2025, con una valoración de 3.300 millones, y se informa que la compañía está en conversaciones para levantar fondos valorados en 7.500 millones. La empresa ha superado los 450,000 desarrolladores y ha alcanzado más de 100 millones de dólares en ingresos anuales.

El lanzamiento de la plataforma de voz representa la expansión de Together más allá de su negocio principal de inferencia de modelos de lenguaje en el mercado creciente de IA de voz, donde la latencia y la fiabilidad siguen siendo puntos críticos para implementaciones en producción.

Fuente de la imagen: Shutterstock

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado