Cartesia запускает модели Sonic-3,5 TTS и Ink-2 STT для голосового AI в реальном времени

S-1,25%
SONIC-1,77%
AI-стартап Cartesia, о победе сообщает Beating, объявил о запуске Sonic-3.5 и Ink-2, сформировав единую технологическую платформу real-time voice agent. Sonic-3.5 отвечает за текстовую синтезацию речи: задержка вывода первого токена составляет 90 миллисекунд, поддерживается 42 языка. Ink-2 выполняет распознавание речи в текст с частотой ошибок на словах 3,6% и имеет нативное определение очередности реплик на основе семантического понимания, а не только длительности пауз в тишине. Обе модели интегрируются через один API с двунаправленным стримингом, чтобы минимизировать задержки передачи.
Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев