Cartesia ra mắt các mô hình Sonic-3.5 TTS và Ink-2 STT cho AI giọng nói thời gian thực

2026-06-16 11:01:31

S-1,25%

Theo Beating, startup giọng nói do AI của Cartesia đã công bố việc ra mắt Sonic-3.5 và Ink-2, tạo thành một ngăn xếp công nghệ tác nhân giọng nói thời gian thực thống nhất. Sonic-3.5 thực hiện chuyển văn bản thành giọng nói với độ trễ token đầu tiên 90 mili giây và hỗ trợ 42 ngôn ngữ. Ink-2 cung cấp chuyển giọng nói thành văn bản với tỷ lệ lỗi từ 3,6% và nhận diện lượt nói theo ngữ nghĩa một cách tự nhiên, thay vì chỉ dựa vào thời lượng im lặng. Cả hai mô hình tích hợp thông qua một API duy nhất với streaming hai chiều nhằm giảm thiểu độ trễ truyền tải.

Xem nguồn

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.

Tin tức liên quan

5giờ trước

OpenAI sẽ ra mắt GPT-5.6 vào ngày 23 tháng 6 với ngữ cảnh token 1,5 triệu, được định giá bằng một phần ba Claude Fable 5

7giờ trước

Qualcomm đang đàm phán mua startup chip AI Tenstorrent với giá 8–10 tỷ USD

11giờ trước

Salesforce mua lại nền tảng AI chăm sóc khách hàng Fin với giá 3,6 tỷ USD, cổ phiếu tăng 1,1%

13giờ trước

Qualcomm nhắm tới thương vụ mua lại Tenstorrent để $8B đến $10B nhằm nâng cao năng lực chip AI

06-15 11:57

Moonshot AI ra mắt Kimi K2.7 Code HighSpeed, nhanh gấp 6 lần với giá API đôi

Phân tích chuyên sâu