Повідомлення Gate News, 17 квітня — Google представила Gemini 3.1 Flash TTS, вдосконалену модель тексту в мовлення з розширеними функціями емоційного вираження та керування, 15 квітня. Нову модель буде поступово впроваджено через API для розробників, корпоративний Vertex AI та інструменти для співпраці.
Ключові можливості моделі включають аудіотеги на основі природної мови для точного налаштування швидкості, інтонації та емоції, а також “Director Mode” для вказання сцен і ролей персонажів, щоб генерувати більш нюансовані голосові результати. Багатоголосий режим дає змогу одночасно генерувати діалоги, дозволяючи природніші сценарії розмов, що підходять для подкастів, аудіоконтенту та ШІ-асистентів. Модель підтримує понад 70 мов і діалектів, відображаючи регіональні акценти та вирази для локалізованого голосового досвіду в усьому світі.
Google наголосила на продуктивності та економічній ефективності: досягнено високих показників на сліпих бенчмарках людської оцінки, водночас зменшено обчислювальні витрати завдяки архітектурі Flash — розробленій для масштабованого корпоративного впровадження. Згенерований аудіоконтент містить водяний знак SynthID для ідентифікації контенту, створеного ШІ, та боротьби з дезінформацією.
Цей крок відображає загострення конкуренції в голосових інтерфейсах. OpenAI поєднує функції голосу в реальному часі з розмовним ШІ для взаємодії, схожої на людську, тоді як Meta розширює інвестиції в ШІ-персонажів із соціальним досвідом на основі голосу. Аналітики галузі зазначають, що хоча високорівнева акторська майстерність і творча робота можуть і надалі залишатися керованими людьми, ринки повторюваного та великомасштабного виробництва можуть поступово переходити до використання ШІ в дубляжі, рекламі та сегменті аудіокниг.
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до
Застереження.
Пов'язані статті
Китай посилюватиме законодавчу базу для ШІ, цифрової економіки та блокчейну
Китай планує посилити свою систему мережевого законодавства для задоволення потреб розвитку інтернету, зосередившись на законодавстві для ШІ, цифрової економіки та інших технологічних секторів. До грудня 2025 року, як очікується, ухвалять понад 180 законів, хоча чинні нормативні акти досі відстають від суспільних очікувань.
GateNews15хв. тому
Intchains Group Розкриває 8,040 ETH, Поставлених на Стейкінг, Прискорює Трансформацію Операцій, Підсилену ШІ
Intchains Group повідомила про сукупне стейкінгування 8,040 ETH зі стратегією, що включає платформу FalconX і власний Goldshell Stake. Компанія також удосконалює операції за допомогою автоматизації на основі ШІ, щоб підвищити ефективність і якість прийняття рішень.
GateNews45хв. тому
威джекай (ADATA), Джей Чоу заробив купу грошей? GD-лійська (GD) менеджерська компанія таємно зустрілася з королівською родиною Дубая, обговорювали IPO, AI та роботів
Корейська медіа-технологічна компанія Galaxy Corporation нещодавно вийшла на ринки Близького Сходу, заснувала дубайську юрособу «Galaxy ME» та зустрілася з представниками королівської сім'ї ОАЕ, досліджуючи інтеграцію AI та контенту. Компанія вже обрала андеррайтера для проведення IPO; минулого року її виручка сягнула 3000 млрд корейських вон, і вона також привернула інвестиції Джей Чоу та ADATA. Цей задум спрямований на розвиток розважальної екосистеми на Близькому Сході та підкреслює важливість її глобалізаційної стратегії.
ChainNewsAbmedia2год тому
Китайська команда EvoMap розлютилась через раптову популярність Hermes Agent: у власній еволюційній системі існує висока схожість
Команда з Китаю EvoMap звинувачує Hermes Agent від Nous Research у плагіаті їхньої архітектури Evolver/GEP, вважаючи, що обидва рішення мають високу схожість у кількох ключових модулях. EvoMap зазначає, що в дизайні Hermes не було посилань або подяк за їхній попередньо опублікований матеріал; суперечка викликала широкий інтерес у спільноті. Частина китайських користувачів мережі підтримала EvoMap і розкритикувала плагіатні дії Hermes. Хоча команда Nous Research ще не спростувала звинувачення в розрізі кожного пункту, подія швидко поширилася в AI-інформаційному просторі.
ChainNewsAbmedia2год тому
Інвестори на ранніх етапах OpenAI це люблять! Новий стартап у сфері мозкових комп’ютерних інтерфейсів Sabi планує відвантажити «шапку» найшвидше до кінця року — «думками можна писати»
Силіконова долина стартап Sabi оголосила, що розробляє носимий мозково-комп’ютерний інтерфейс без потреби в інвазивному хірургічному втручанні. Користувачеві достатньо «думати», щоб увести текст на екран; запуск планується до кінця 2026 року. Пристрій буде оснащено аж до 100000 мікродатчиків, що допоможе точно інтерпретувати активність мозку; Sabi також підкреслює захист конфіденційності даних.
ChainNewsAbmedia2год тому
Дані викривають, що «Claude знижає рівень» — це не міський міф; нестабільність AI-моделі є ризиком для компанії
Стаття досліджує явище нестабільної роботи LLM (великі мовні моделі) в прикладному використанні AI-підприємствами, яке називають «зниженням інтелекту», і наводить приклади його реального впливу на робочі процеси компаній. Дані показують, що більшість основних моделей перебувають у стані зниження рівня, що впливає на продуктивність і стабільність підприємств; компаніям потрібно почати приділяти увагу стабільності моделей як новому стандарту, інакше вони ризикуватимуть інфраструктурою.
ChainNewsAbmedia3год тому