Thinking Machines запускає модель взаємодії з відгуком 200 мс, випереджаючи GPT-Realtime-2.0

Beating, Thinking Machines, лабораторія, заснована колишнім технічним директором OpenAI Мірою Мураті, випустила дослідницький прев’ю свого Interaction-моделю, який пропонує нативну обробку аудіо та відео в реальному часі з мікровідповідями на 200 мілісекунд. Модель дає змогу одночасно слухати, дивитися й говорити, підтримуючи переривання користувачем у реальному часі.

Модель TML-Interaction-Small використовує архітектуру MoE із 276 мільярдами параметрів, де під час кожного інференсу активується 12 мільярда параметрів. Офіційні дані показують затримку в передачі реплік мовлення 0,40 секунди та результат FD-bench V1.5 на рівні 77,8 — обидва показники перевищують GPT-Realtime-2.0 і Gemini 3.1 Flash Live. Обмежений доступ до прев’ю планують у найближчі місяці.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Цього тижня на нас чекає щільний потік макроекономічних каталізаторів: від публікації CPI до огляду в загальній картині розгляду законопроєкту CLARITY

2026 年 5 月 середини, криптовалютний ринок переживає надзвичайно рідкісне макроекономічне вікно підвищеної чутливості. Дані інфляції США за квітень (CPI) будуть опубліковані 12 травня, саміт Чжуан/Бай у Пекіні запланований на 13–15 травня, а сенатський комітет з банківських справ розглядатиме законопроєкт CLARITY (Закон про прозорість ринку цифрових активів) 14 травня. Три незалежні, але надзвичайно пов’язані події концентровано відбуваються протягом якихось чотирьох днів, формуючи поетапний стре

GateInstantTrends5хв. тому

AI-стартап для голосових інтеграцій Vapi завершує $50M раунд серії B на чолі з Peak XV Partners

За даними TechCrunch, Vapi, стартап з AI-озвучення, завершив раунд Series B на 50 мільйонів доларів, який очолила Peak XV Partners, із постмаркетинговою оцінкою приблизно в 500 мільйонів доларів. Ring — підрозділ Amazon — розгорнув Vapi, щоб обробляти 100% вхідних дзвінків після оцінювання понад 40 постачальників AI-голосів, допомігши стимулювати цей раунд фінансування.

GateNews35хв. тому

Точність GPT-5.4 знижується зі 100% до 54% на ARC-AGI після багаторазового підсумовування пам’яті

За Beating нещодавнє дослідження пам’яті агентів від Dylan Zhang, докторанта Університету Іллінойсу, показало, що повторне підсумовування досвіду моделі може погіршувати продуктивність, а не покращувати її. У завданнях ARC-AGI GPT-5.4 досяг 100% точності на 19 проблемах без пам’яті, але після кількох раундів компресії пам’яті на основі правильних траєкторій розв’язання точність знизилася до 54%. Аналогічно, у завданнях шопінгу WebShop метод AWM набрав 0,64 з 8 експертними траєкторіями, але впав

GateNews47хв. тому

NVIDIA та MIT випускають фреймворк Lightning OPD для покращення ефективності дистиляції моделей у 4 рази та усунення проблем із пам’яттю GPU

За повідомленнями, дослідники NVIDIA та MIT випустили Lightning OPD (Offline On-Policy Distillation) — нову посттренувальну методику для великих мовних моделей, яка усуває потребу тримати модель-вчителя запущеною під час навчання. Завдяки попередньому обчисленню лог-імовірностей моделі-вчителя офлайн фреймворк підвищує ефективність навчання у 4 рази, одночасно звільняючи всі ресурси GPU для тренування моделі-студента. Під час тестування на 8 GPU NVIDIA H100 Lightning OPD успішно дистилювала Qwen

GateNews1год тому

OpenAI розширює Програму довіреного доступу для десятків європейських підприємств 12 травня

За повідомленнями від 12 травня, OpenAI оголосила про плани розширити свою програму Trusted Access для десятків європейських підприємств.

GateNews1год тому

Живий Transformers! Uкритрська технологія представила перший у світі серійний роботизований носій, ціна 570 тис. доларів

Китайська робототехнічна компанія Unitree Robotics (宇樹科技) 12 травня представила свій новий продукт GD01 — керований людиною мех-робот, який може вільно перемикатися між двоногою гуманоїдною ходою та режимом чотириногого лазіння. Можна сказати, що його зробили так, ніби кадри з науково-фантастичних епопей «Трансформери» та «Тихоокеанський рубіж» перенесли в реальність. Цей реліз — це не лише технологічна сенсація, а й відображення того, як швидко в Китаї рухається індустрія роботів. Unitree Unvei

ChainNewsAbmedia2год тому
Прокоментувати
0/400
Немає коментарів