Resemble AI выпускает DramaBox — модель управляемой речи на уровне режиссёра — уже сегодня на Hugging Face

ON-6,64%
PROMPT-10,03%
IN27,2%

Beating, Resemble AI выпустила DramaBox, модель генерации речи, на Hugging Face сегодня. Модель отличается управляемостью на уровне режиссёра благодаря разделённому синтаксису подсказок: пользователи вводят реплики в кавычках, указывая при этом сценические ремарки вроде вздохов, пауз или шёпота вне кавычек. Модель превращает эти ремарки в эмоционально окрашенную речь, а не зачитывает их вслух.

DramaBox поддерживает zero-shot клонирование голоса всего по 10 секундам референсного аудио и позволяет задавать возраст персонажа, акцент и эмоции через подсказки на естественном языке. Выходной сигнал — аудио студийного качества в стерео с частотой 48 кГц. Всё сгенерированное аудио включает невидимый водяной знак Perth, устойчивый к MP3-сжатию, а также стандартные аудиоредакторские инструменты, чтобы предотвратить злоупотребление глубокими подделками.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев