Cartesia запускает модели Sonic-3,5 TTS и Ink-2 STT для голосового AI в реальном времени
AI-стартап Cartesia, о победе сообщает Beating, объявил о запуске Sonic-3.5 и Ink-2, сформировав единую технологическую платформу real-time voice agent. Sonic-3.5 отвечает за текстовую синтезацию речи: задержка вывода первого токена составляет 90 миллисекунд, поддерживается 42 языка. Ink-2 выполняет распознавание речи в текст с частотой ошибок на словах 3,6% и имеет нативное определение очередности реплик на основе семантического понимания, а не только длительности пауз в тишине. Обе модели инте