Alibaba запускає AI-модель світу Happy Oyster для створення віртуальних сцен у реальному часі

Повідомлення Gate News, 17 квітня — Alibaba представила Happy Oyster, AI-модель світу, призначену для створення та взаємодії з віртуальними світами в реальному часі, на день після того, як World Labs представила Spark 2.0. Продукт дає змогу користувачам будувати сцени за текстовими та зображувальними підказками, генерувати відеокліпи тривалістю до трьох хвилин і отримувати нові інструкції під час створення.

Happy Oyster, раніше розроблену під назвою HappyHorse-1.0 інноваційним підрозділом ATH компанії Alibaba, оснащено двома основними режимами. Режим “Directing” дозволяє користувачам коригувати елементи сюжету та кути камери під час генерації відео, створюючи до трьох хвилин безперервного відео з роздільною здатністю 480p або 720p. Режим “Wandering” підтримує дослідження з перспективи першої особи з використанням стандартних клавіатурних і камерних керувань.

Запуск відображає ширшу стратегію Alibaba щодо розширення її AI-можливостей за межі мовних моделей — у системи, які можуть вчитися на основі та розуміти фізичну реальність. Це підсилює позиції Alibaba в більш близькій конкуренції з суперниками, зокрема Tencent і її моделлю світу HY-World 2.0, оскільки компанії змагаються за можливості отримання доходу в AI-генерованому інтерактивному контенті для ігрових та кінематографічних застосувань.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Anthropic співпрацює з TrendAI, щоб інтегрувати моделі Claude в корпоративну платформу безпеки на основі ШІ

TrendAI співпрацює з Anthropic, щоб інтегрувати моделі Claude у свою платформу, посилюючи дослідження загроз і операції з безпеки на основі ШІ. Ця співпраця спрямована на виявлення вразливостей до запуску в продакшн, що відображає зміну в бік AI-безпеки в індустрії.

GateNews13хв. тому

OpenAI погоджується сплатити понад $20 мільярдів доларів США за чипи Cerebras протягом трьох років і отримує частку в капіталі

OpenAI погодився придбати понад $20 мільярдів доларів США в чипах для ШІ в Cerebras протягом трьох років, отримавши частку в капіталі компанії, щоб знизити витрати на обчислення у міру розширення своїх сервісів зі штучного інтелекту.

GateNews13хв. тому

Міністр ШІ Великої Британії розкритикував OpenAI за призупинення проєкту дата-центру Stargate

Міністр ШІ Британії розкритикував рішення OpenAI призупинити проєкт зі створення дата-центру в Ірландії, пов’язавши це з проблемами фінансування, а не з цінами на енергоносії. Microsoft має намір орендувати потужності на іншому майданчику, що вплине на цілі інвестицій Великої Британії в галузі ШІ.

GateNews23хв. тому

SenseTime залучає $415M через розміщення акцій у Гонконзі зі знижкою 8,6%

SenseTime Group залучає 3,25 млрд гонконгських доларів через розміщення акцій у Гонконзі, випускаючи 1,7 млрд акцій зі знижкою 8,6%. Кошти підтримають його інфраструктуру та дослідження в галузі ШІ, тоді як акції за рік до дати публікації знизилися на 9,6%.

GateNews33хв. тому

Google запускає Gemini 3.1 Flash TTS із покращеним емоційним вираженням і багатоголосими можливостями

Google випустила Gemini 3.1 Flash TTS — вдосконалену модель тексту в мовлення з покращеним емоційним вираженням і керуванням. Серед можливостей — природномовні аудіотеги, Director Mode для більш нюансованих результатів і багатоголосий режим для реалістичних розмов. Підтримуючи понад 70 мов, і створена для ефективності, вона має на меті посилити контент, згенерований ШІ, та протидіяти дезінформації. Запуск відображає зростання конкуренції в технологіях голосу, зокрема з боку OpenAI та Meta.

GateNews51хв. тому

Bytedance спростовує повідомлення про те, що дослідник DeepSeek Го Даа приєднався із зарплатою в сотні мільйонів юанів

Bytedance спростувала повідомлення про те, що дослідник Го Даа приєднався до її команди Seed із зарплатою 100 мільйонів юанів. Го підтвердив свою роль як lead агентів, але деталі зарплати не розкрито, тоді як структура винагород для команди є уніфікованою.

GateNews3год тому
Прокоментувати
0/400
Немає коментарів