Cartesia ra mắt các mô hình Sonic-3.5 TTS và Ink-2 STT cho AI giọng nói thời gian thực

S-1,25%
SONIC-1,77%
Theo Beating, startup giọng nói do AI của Cartesia đã công bố việc ra mắt Sonic-3.5 và Ink-2, tạo thành một ngăn xếp công nghệ tác nhân giọng nói thời gian thực thống nhất. Sonic-3.5 thực hiện chuyển văn bản thành giọng nói với độ trễ token đầu tiên 90 mili giây và hỗ trợ 42 ngôn ngữ. Ink-2 cung cấp chuyển giọng nói thành văn bản với tỷ lệ lỗi từ 3,6% và nhận diện lượt nói theo ngữ nghĩa một cách tự nhiên, thay vì chỉ dựa vào thời lượng im lặng. Cả hai mô hình tích hợp thông qua một API duy nhất với streaming hai chiều nhằm giảm thiểu độ trễ truyền tải.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận