Согласно BridgeBench AI и Arena.AI, восстановление Claude Fable 5 1 июля вызвало противоречивые результаты бенчмарков. BridgeBench сообщил, что показатели отладки упали с 86,2 до 25,9, но данные показали, что девять из двенадцати задач были перенаправлены на Opus 4.8 новым классификатором безопасности Anthropic, а не достигли самого Fable 5. В то же время тысячи голосов человеческих предпочтений Arena.AI показали, что производительность Fable 5 в целом осталась на прежнем уровне или улучшилась в большинстве категорий, когда модель действительно обрабатывала запросы: работа с документами выросла на 34 очка Эло, а экспертные тексты — на 25.

Это различие имеет значение: обычные пользователи в области творческого письма, исследований и анализа текста увидят минимальные изменения, в то время как разработчики, работающие над исправлением кода и отладкой, столкнутся с постоянной переадресацией. Anthropic признала, что новые классификаторы слишком широко блокировали подсказки, связанные с эксплойтами, и заявила, что улучшения будут внесены со временем, но сроков не назвала.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

12ч назад

Вероятность победы TES упала с 92% до 53% на рынке predict.fun MSI, после того как G2 вынудила провести решающую пятую игру.

19ч назад

Fable 5 сталкивается со значительным снижением производительности после перезапуска 3 июля

07-02 09:10

DeepSeek Web и API-сервисы испытывают снижение производительности 2 июля

07-02 08:01

B.AI возобновляет поддержку Claude Fable 5 API 2 июля с двухканальным доступом

07-01 16:50

США снимают экспортные ограничения на модели Claude Fable 5 и Mythos 5 от Anthropic

Детальный анализ