Исследование памяти агента от Beating, проведённое Диланом Чжаном, аспирантом Университета Иллинойса, показало, что многократное резюмирование опыта модели может ухудшать производительность, а не улучшать её. В задачах ARC-AGI GPT-5.4 достиг 100% точности на 19 проблемах без памяти, но после нескольких раундов компрессии памяти на основе правильных траекторий решения точность упала до 54%. Аналогично, в задачах покупок WebShop метод AWM показал результат 0,64 с 8 экспертными траекториями, но снизился до 0,20 при 128 траекториях, вернувшись к базовому уровню. Исследование предполагает, что проблема связана с чрезмерным резюмированием: каждый шаг абстракции теряет конкретные детали и смешивает зависящие от задачи правила в универсальные подсказки, в итоге ухудшая производительность модели.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

05-12 06:01

Цзянсу запускает ориентированные на ИИ политики и создаёт зоны инноваций для разметки данных 12 мая

05-12 03:29

Загрузки Grok падают до 8,3 млн в апреле с 20 млн в январе, отставая по внедрению пользователей от ChatGPT

05-12 03:13

Семь моделей ИИ демонстрируют защитное поведение, чтобы предотвратить отключение со стороны участников — исследование от 12 мая

05-11 12:05

Основатель Cognition заявил, что ИИ превзошёл людей в чистом рассуждении; преимущество человека — в извлечении информации из памяти

05-11 11:31

Центральный банк Китая выделяет AI-индустрию как ключевой драйвер экономического роста в отчёте за 1 квартал

Детальный анализ