Resemble AI lance DramaBox, un modèle de discours contrôlable de niveau directeur, sur Hugging Face aujourd’hui

ON-6,94%
PROMPT-9,46%
IN23,25%

Beating a annoncé que Resemble AI a publié DramaBox, un modèle de génération de discours, sur Hugging Face aujourd’hui. Le modèle offre un contrôle de niveau réalisateur grâce à une syntaxe de prompt séparée : les utilisateurs saisissent le dialogue entre guillemets tout en précisant des indications de scène telles que des soupirs, des pauses ou des chuchotements en dehors des guillemets. Le modèle transforme ces indications en discours avec inflexions émotionnelles, plutôt que de les lire à voix haute.

DramaBox prend en charge le clonage vocal zero-shot avec seulement 10 secondes d’audio de référence et permet des prompts en langage naturel pour définir l’âge, l’accent et l’émotion du personnage. La sortie propose un audio stéréo en 48 kHz de qualité studio. Tous les audios générés incluent un filigrane Perth invisible, résistant à la compression MP3, ainsi qu’un traitement audio standard afin d’empêcher tout usage abusif des deepfakes.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire