Beating, Thinking Machines, лабораторія, заснована колишнім технічним директором OpenAI Мірою Мураті, випустила дослідницький прев’ю свого Interaction-моделю, який пропонує нативну обробку аудіо та відео в реальному часі з мікровідповідями на 200 мілісекунд. Модель дає змогу одночасно слухати, дивитися й говорити, підтримуючи переривання користувачем у реальному часі.
Модель TML-Interaction-Small використовує архітектуру MoE із 276 мільярдами параметрів, де під час кожного інференсу активується 12 мільярда параметрів. Офіційні дані показують затримку в передачі реплік мовлення 0,40 секунди та результат FD-bench V1.5 на рівні 77,8 — обидва показники перевищують GPT-Realtime-2.0 і Gemini 3.1 Flash Live. Обмежений доступ до прев’ю планують у найближчі місяці.
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до
Застереження.
Пов'язані статті
Цього тижня на нас чекає щільний потік макроекономічних каталізаторів: від публікації CPI до огляду в загальній картині розгляду законопроєкту CLARITY
2026 年 5 月 середини, криптовалютний ринок переживає надзвичайно рідкісне макроекономічне вікно підвищеної чутливості. Дані інфляції США за квітень (CPI) будуть опубліковані 12 травня, саміт Чжуан/Бай у Пекіні запланований на 13–15 травня, а сенатський комітет з банківських справ розглядатиме законопроєкт CLARITY (Закон про прозорість ринку цифрових активів) 14 травня. Три незалежні, але надзвичайно пов’язані події концентровано відбуваються протягом якихось чотирьох днів, формуючи поетапний стре
GateInstantTrends5хв. тому
AI-стартап для голосових інтеграцій Vapi завершує $50M раунд серії B на чолі з Peak XV Partners
За даними TechCrunch, Vapi, стартап з AI-озвучення, завершив раунд Series B на 50 мільйонів доларів, який очолила Peak XV Partners, із постмаркетинговою оцінкою приблизно в 500 мільйонів доларів. Ring — підрозділ Amazon — розгорнув Vapi, щоб обробляти 100% вхідних дзвінків після оцінювання понад 40 постачальників AI-голосів, допомігши стимулювати цей раунд фінансування.
GateNews35хв. тому
Точність GPT-5.4 знижується зі 100% до 54% на ARC-AGI після багаторазового підсумовування пам’яті
За Beating нещодавнє дослідження пам’яті агентів від Dylan Zhang, докторанта Університету Іллінойсу, показало, що повторне підсумовування досвіду моделі може погіршувати продуктивність, а не покращувати її. У завданнях ARC-AGI GPT-5.4 досяг 100% точності на 19 проблемах без пам’яті, але після кількох раундів компресії пам’яті на основі правильних траєкторій розв’язання точність знизилася до 54%. Аналогічно, у завданнях шопінгу WebShop метод AWM набрав 0,64 з 8 експертними траєкторіями, але впав
GateNews47хв. тому
NVIDIA та MIT випускають фреймворк Lightning OPD для покращення ефективності дистиляції моделей у 4 рази та усунення проблем із пам’яттю GPU
За повідомленнями, дослідники NVIDIA та MIT випустили Lightning OPD (Offline On-Policy Distillation) — нову посттренувальну методику для великих мовних моделей, яка усуває потребу тримати модель-вчителя запущеною під час навчання. Завдяки попередньому обчисленню лог-імовірностей моделі-вчителя офлайн фреймворк підвищує ефективність навчання у 4 рази, одночасно звільняючи всі ресурси GPU для тренування моделі-студента. Під час тестування на 8 GPU NVIDIA H100 Lightning OPD успішно дистилювала Qwen
GateNews1год тому
OpenAI розширює Програму довіреного доступу для десятків європейських підприємств 12 травня
За повідомленнями від 12 травня, OpenAI оголосила про плани розширити свою програму Trusted Access для десятків європейських підприємств.
GateNews1год тому
Живий Transformers! Uкритрська технологія представила перший у світі серійний роботизований носій, ціна 570 тис. доларів
Китайська робототехнічна компанія Unitree Robotics (宇樹科技) 12 травня представила свій новий продукт GD01 — керований людиною мех-робот, який може вільно перемикатися між двоногою гуманоїдною ходою та режимом чотириногого лазіння. Можна сказати, що його зробили так, ніби кадри з науково-фантастичних епопей «Трансформери» та «Тихоокеанський рубіж» перенесли в реальність. Цей реліз — це не лише технологічна сенсація, а й відображення того, як швидко в Китаї рухається індустрія роботів. Unitree Unvei
ChainNewsAbmedia2год тому