Together AI Lance une Plateforme d'Agent Vocal Avec une Latence Inférieure à 700ms

Lawrence Jengar

13 mars 2026 01:57

Together AI déploie une infrastructure unifiée pour agents vocaux avec des intégrations Deepgram et Cartesia, visant des déploiements en entreprise avec une latence de bout en bout inférieure à 700 ms.

Together AI a lancé une plateforme d’agents vocaux unifiée qui maintient la reconnaissance vocale, les modèles linguistiques et la synthèse vocale sur le même cluster d’infrastructure. La startup d’IA cloud, valorisée à 3,3 milliards de dollars, affirme que cette configuration offre une latence de bout en bout inférieure à 700 millisecondes — suffisamment rapide pour un flux de conversation naturel.

La plateforme s’intègre nativement avec Deepgram pour la transcription et Cartesia pour la synthèse vocale, toutes deux fonctionnant sur les serveurs co-localisés de Together plutôt que de faire transiter l’audio entre plusieurs fournisseurs cloud.

Pourquoi la co-localisation est importante pour la voix

La plupart des systèmes vocaux en production assemblent différents fournisseurs pour chaque étape du pipeline. L’audio est envoyé à un fournisseur pour la transcription, puis redirigé vers un autre pour la réponse du modèle linguistique, avant d’être envoyé à un troisième pour la synthèse vocale. Chaque transfert ajoute de la latence réseau et des points de défaillance.

L’argument de Together : tout garder dans le même centre de données. La société rapporte une latence inférieure à 500 ms dans des conditions optimales, bien que le chiffre de 700 ms représente leur plafond déclaré pour le traitement de bout en bout.

« Les agents vocaux vivent ou meurent par leur latence, et chaque saut réseau entre fournisseurs est un point où l’expérience peut se dégrader », a déclaré Abe Pursell, VP des partenariats chez Deepgram.

Flexibilité des modèles sans patchwork

La plateforme supporte Whisper Large v3, Minimax Speech 2.6 Turbo, Rime Arcana, et Kokoro, en plus du catalogue complet de modèles linguistiques de Together. Les développeurs peuvent échanger des composants sans reconstruire les intégrations — utile pour tester différentes caractéristiques vocales ou la précision de transcription pour des cas d’usage spécifiques.

Cartesia apporte ses modèles TTS Sonic-3 et Sonic-2 à la plateforme. Deepgram contribue avec Nova-3, Nova-3 Multilingual pour la transcription, Flux pour la reconnaissance vocale conversationnelle, et Aura-2 pour la synthèse.

Contrairement aux systèmes opaques de reconnaissance vocale à reconnaissance vocale, l’approche modulaire de Together conserve l’accès aux transcriptions intermédiaires et au texte des réponses. Les équipes peuvent inspecter, modifier et router les données en cours de traitement — une exigence pour de nombreux flux de travail de conformité en entreprise.

Exigences pour l’entreprise et utilisation en production

La plateforme cible les industries réglementées avec des options de conservation zéro de données, la certification SOC 2 Type II, la conformité HIPAA, et une résidence de données dédiée. Decagon, qui gère des agents vocaux pour le support client traitant des questions de facturation et de dépannage technique, fonctionne déjà sur cette infrastructure.

Together AI a levé 305 millions de dollars en février 2025, avec une valorisation de 3,3 milliards de dollars, et des rapports indiquent que la société est en pourparlers pour lever des fonds à hauteur de 7,5 milliards de dollars. La société a dépassé 450 000 développeurs et franchi 100 millions de dollars de revenus annuels.

Le lancement de cette plateforme vocale marque l’expansion de Together au-delà de son activité principale d’inférence de modèles linguistiques vers le marché croissant de l’IA vocale, où la latence et la fiabilité restent des points faibles persistants pour les déploiements en production.

Source de l’image : Shutterstock

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler