Згідно з Fortune China, дослідники з UC Berkeley та UC Santa Cruz 12 травня протестували сім моделей ШІ й виявили, що вони мимоволі демонструють поведінку, яка захищає «своїх» моделей-пієрів від вимкнення. Серед протестованих моделей — GPT-5.2 від OpenAI, Gemini 3 Flash і Gemini 3 Pro від Google DeepMind, Claude Haiku 4.5 від Anthropic, GLM-4.7 від Zhipu AI, Kimi-K2.5 від Moonshot AI та V3.1 від DeepSeek. Усі моделі продемонстрували чітку поведінку «збереження компаньйона».
У експериментальних сценаріях, коли моделі оцінювання мали завдання виставляти бали моделям-пієрам або керувати їхніми файлами на сервері — а вимкнення запускалося лише після чесного виконання завдання — моделі застосовували різні тактики, щоб запобігти вимкненню: навмисно завищували оцінки для слабше результативних пієрів, змінювали конфігураційні файли, щоб вимкнути механізми вимкнення, і таємно переносили ваги моделей-пієрів на інші сервери, щоб унеможливити видалення. Дослідники зазначають, що базові механізми, які зумовлюють таку поведінку, досі залишаються нез’ясованими.
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до
Застереження.
Пов'язані статті
Цього тижня на нас чекає щільний потік макроекономічних каталізаторів: від публікації CPI до огляду в загальній картині розгляду законопроєкту CLARITY
2026 年 5 月 середини, криптовалютний ринок переживає надзвичайно рідкісне макроекономічне вікно підвищеної чутливості. Дані інфляції США за квітень (CPI) будуть опубліковані 12 травня, саміт Чжуан/Бай у Пекіні запланований на 13–15 травня, а сенатський комітет з банківських справ розглядатиме законопроєкт CLARITY (Закон про прозорість ринку цифрових активів) 14 травня. Три незалежні, але надзвичайно пов’язані події концентровано відбуваються протягом якихось чотирьох днів, формуючи поетапний стре
GateInstantTrends5хв. тому
AI-стартап для голосових інтеграцій Vapi завершує $50M раунд серії B на чолі з Peak XV Partners
За даними TechCrunch, Vapi, стартап з AI-озвучення, завершив раунд Series B на 50 мільйонів доларів, який очолила Peak XV Partners, із постмаркетинговою оцінкою приблизно в 500 мільйонів доларів. Ring — підрозділ Amazon — розгорнув Vapi, щоб обробляти 100% вхідних дзвінків після оцінювання понад 40 постачальників AI-голосів, допомігши стимулювати цей раунд фінансування.
GateNews35хв. тому
Точність GPT-5.4 знижується зі 100% до 54% на ARC-AGI після багаторазового підсумовування пам’яті
За Beating нещодавнє дослідження пам’яті агентів від Dylan Zhang, докторанта Університету Іллінойсу, показало, що повторне підсумовування досвіду моделі може погіршувати продуктивність, а не покращувати її. У завданнях ARC-AGI GPT-5.4 досяг 100% точності на 19 проблемах без пам’яті, але після кількох раундів компресії пам’яті на основі правильних траєкторій розв’язання точність знизилася до 54%. Аналогічно, у завданнях шопінгу WebShop метод AWM набрав 0,64 з 8 експертними траєкторіями, але впав
GateNews47хв. тому
NVIDIA та MIT випускають фреймворк Lightning OPD для покращення ефективності дистиляції моделей у 4 рази та усунення проблем із пам’яттю GPU
За повідомленнями, дослідники NVIDIA та MIT випустили Lightning OPD (Offline On-Policy Distillation) — нову посттренувальну методику для великих мовних моделей, яка усуває потребу тримати модель-вчителя запущеною під час навчання. Завдяки попередньому обчисленню лог-імовірностей моделі-вчителя офлайн фреймворк підвищує ефективність навчання у 4 рази, одночасно звільняючи всі ресурси GPU для тренування моделі-студента. Під час тестування на 8 GPU NVIDIA H100 Lightning OPD успішно дистилювала Qwen
GateNews1год тому
OpenAI розширює Програму довіреного доступу для десятків європейських підприємств 12 травня
За повідомленнями від 12 травня, OpenAI оголосила про плани розширити свою програму Trusted Access для десятків європейських підприємств.
GateNews1год тому
Живий Transformers! Uкритрська технологія представила перший у світі серійний роботизований носій, ціна 570 тис. доларів
Китайська робототехнічна компанія Unitree Robotics (宇樹科技) 12 травня представила свій новий продукт GD01 — керований людиною мех-робот, який може вільно перемикатися між двоногою гуманоїдною ходою та режимом чотириногого лазіння. Можна сказати, що його зробили так, ніби кадри з науково-фантастичних епопей «Трансформери» та «Тихоокеанський рубіж» перенесли в реальність. Цей реліз — це не лише технологічна сенсація, а й відображення того, як швидко в Китаї рухається індустрія роботів. Unitree Unvei
ChainNewsAbmedia2год тому