Mensaje de Gate News, 17 de abril — Google presentó Gemini 3.1 Flash TTS, un modelo avanzado de texto a voz con funciones de expresión emocional y control mejoradas, el 15 de abril. El nuevo modelo se irá implementando de forma progresiva mediante APIs para desarrolladores, Vertex AI empresarial y herramientas de colaboración.
Las capacidades principales del modelo incluyen etiquetas de audio basadas en lenguaje natural para ajustar la velocidad, la entonación y la emoción, además de un “Modo Director” para especificar escenas y funciones de los personajes y generar salidas de voz más matizadas. Una función de múltiples hablantes permite generar diálogos simultáneos, posibilitando flujos de conversación más naturales adecuados para podcasts, contenido de audio y asistentes de IA. El modelo admite más de 70 idiomas y dialectos, reflejando acentos y expresiones regionales para experiencias de voz localizadas en todo el mundo.
Google enfatizó el rendimiento y la eficiencia en costos, logrando puntuaciones altas en puntos de referencia de evaluación humana a ciegas mientras reducía los costos computacionales mediante su arquitectura Flash, diseñada para la adopción a gran escala en empresas. El audio generado incluye marcas de agua SynthID para identificar contenido generado por IA y combatir la desinformación.
El movimiento refleja una competencia cada vez más intensa en interfaces de voz. OpenAI combina funciones de voz en tiempo real con IA conversacional para interacciones similares a las humanas, mientras que Meta amplía sus inversiones en personajes de IA con experiencias sociales basadas en voz. Los observadores de la industria señalan que, si bien por ahora el alto nivel de actuación y el trabajo creativo pueden seguir estando impulsados por humanos, los mercados de producción repetitiva y a gran escala podrían ver una adopción gradual de IA en doblaje, publicidad y sectores de audiolibros.
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
China reforzará el marco legislativo para la IA, la economía digital y la cadena de bloques
China planea fortalecer su sistema legal de redes para atender las necesidades del desarrollo de internet, centrándose en la legislación para la IA, la economía digital y otros sectores tecnológicos. Para diciembre de 2025, se esperan más de 180 leyes, aunque las regulaciones actuales aún se quedan rezagadas frente a las expectativas del público.
GateNewsHace14m
Intchains Group Revela 8,040 ETH en Staking y Acelera la Transformación de Operaciones Impulsadas por IA
Intchains Group informó un monto de staking acumulado de 8,040 ETH, con una estrategia que incluye la plataforma FalconX y su propio Goldshell Stake. La empresa también está mejorando las operaciones mediante automatización con IA para impulsar la eficiencia y la toma de decisiones.
GateNewsHace44m
¿Adata y Jay Chou ganan mucho? La agencia de gestión de GD se reúne a puerta cerrada con la familia real de Dubái para hablar sobre la OPV, la IA y los robots
La empresa de tecnología de entretenimiento de Corea Galaxy Corporation recientemente se ha expandido hacia el mercado de Oriente Medio, estableciendo la entidad en Dubái «Galaxy ME», y se reunió con miembros de la familia real de Emiratos Árabes Unidos para explorar la integración de la IA y el contenido. La empresa ya ha seleccionado a un intermediario bursátil para llevar a cabo su IPO; el año pasado sus ingresos alcanzaron 300 mil millones de wones surcoreanos y ha atraído inversiones de Jay Chou y de Adata, entre otros. Este planteamiento tiene como objetivo impulsar el desarrollo del ecosistema de entretenimiento en Oriente Medio, destacando la importancia de su estrategia de globalización.
ChainNewsAbmediahace2h
El equipo de China EvoMap enfurece: el Hermes Agent se vuelve viral por la explosión de popularidad, presunta copia: dentro del sistema de autoevolución existen similitudes de alta intensidad
El equipo de China EvoMap acusa al agente Hermes de Nous Research de copiar su arquitectura Evolver/GEP, y sostiene que ambos presentan un alto grado de similitud en varios módulos clave. EvoMap señala que el diseño de Hermes no hace referencia ni da reconocimiento a su contenido previamente publicado; la polémica ha despertado una amplia atención en la comunidad. Parte de los internautas chinos apoya a EvoMap y critica la conducta de copia de Hermes. Aunque el equipo de Nous aún no ha refutado punto por punto las acusaciones, el incidente se ha difundido rápidamente en la opinión pública sobre IA.
ChainNewsAbmediahace2h
¡A los primeros inversores de OpenAI les encantan! La nueva startup de interfaz cerebro-computadora Sabi lanzará a más tardar a fin de año un gorro de pelo que permite “escribir pensando”
La startup de Silicon Valley Sabi anunció que está desarrollando una interfaz cerebro-computadora portátil que no requiere cirugía invasiva; los usuarios solo tendrán que “pensar” para introducir texto en la pantalla, con una fecha prevista de lanzamiento a finales de 2026. El dispositivo contará con hasta cien mil micro sensores, lo que ayudará a interpretar con precisión la actividad cerebral; Sabi también recalca la protección de la privacidad de los datos.
ChainNewsAbmediahace2h
Se revela que “Claude pierde capacidad” no es un mito urbano; el modelo de IA es inestable y representa un riesgo empresarial
El artículo analiza el fenómeno de la inestabilidad del desempeño de los LLM (modelos de lenguaje a gran escala) en aplicaciones empresariales de IA, al que se le llama «descenso de capacidad» y se brindan ejemplos para explicar su impacto real en los flujos de trabajo de las empresas. Los datos muestran que la mayoría de los modelos principales se encuentran en un estado degradado, lo que afecta la productividad y la estabilidad de las empresas. Las empresas deben empezar a dar prioridad a la estabilidad del modelo como un nuevo estándar; de lo contrario, se enfrentarán a riesgos de infraestructura.
ChainNewsAbmediahace3h