Cartesia เปิดตัวโมเดล Sonic-3.5 TTS และ Ink-2 STT สำหรับ AI เสียงแบบเรียลไทม์

S-2.29%
SONIC-0.35%
ตาม Beating บริษัทสตาร์ทอัพด้านเสียงที่ขับเคลื่อนด้วย AI อย่าง Cartesia ประกาศเปิดตัว Sonic-3.5 และ Ink-2 โดยนำมาจัดเป็นสแต็กเทคโนโลยีเอเจนต์เสียงแบบเรียลไทม์เพียงชุดเดียวที่ทำงานร่วมกัน Sonic-3.5 ทำหน้าที่แปลงข้อความเป็นเสียง โดยมีความหน่วงของโทเค็นแรก 90 มิลลิวินาที และรองรับ 42 ภาษา Ink-2 ส่งมอบความสามารถการแปลงเสียงเป็นข้อความด้วยอัตราความผิดพลาดของคำ 3.6% และตรวจจับการผลัดเทิร์นได้แบบเนทีฟจากความเข้าใจเชิงความหมาย ไม่ได้ยึดตามระยะเวลาความเงียบเพียงอย่างเดียว ทั้งสองโมเดลถูกบูรณาการผ่าน API เดียว พร้อมสตรีมมิงแบบสองทิศทางเพื่อช่วยลดความล่าช้าในการส่งข้อมูลให้ได้มากที่สุด
news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น