Fable 5 провалила все самые сложные задачи в экзамене UC Berkeley ALE и обходится в 4–12 раз дороже, чем конкуренты

2026-06-12 11:01:40

Согласно UC Berkeley RDI, последние результаты оценки Agents' Last Exam (ALE), выпущенные на этой неделе, показывают 0% успешности на самых сложных задачах, требующих длительных рассуждений и глубокой экспертизы, во всех протестированных ИИ-агентах, включая недавно выпущенную Fable 5. В пересчёте на затраты API за задачу Fable 5 взимала 15,70 долларов — в 4 раза больше, чем GPT-5.5 (3,80 доллара), и в 12 раз больше, чем Composer 2.5 (1,33 доллара). Оценка охватила 55 профессиональных доменов с более чем 1 500 экспертно верифицированными задачами и выявила, что агенты чаще всего терпят неудачу, преждевременно объявляя успех, не проверяя результаты.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

2ч назад

Ложный «Fable 5» от Anthropic выявил 24 000 мошеннических аккаунтов, связанных с китайскими AI-компаниями

2ч назад

Claude Fable 5 был взломан в течение 48 часов после релиза; системная подсказка утекла на GitHub

5ч назад

Fable 5 от Anthropic стоит более чем в 50 раз дороже за токен, чем DeepSeek V4 Pro

10ч назад

Morgan Stanley видит суперцикл чипов памяти, который продлится намного дольше конца 2026 года, благодаря спросу со стороны ИИ

17ч назад

Anthropic приносит извинения за скрытые 5 предохранителей в Claude Fable, заменяет их на видимые резервные меры для Opus 4.8 на этой неделе

Детальный анализ