За даними BridgeBench, показник налагодження Claude Fable 5 впав з 86,2 до 25,9 після його відновлення 1 липня, а рефакторинг знизився з 73,6 до 38,4. Однак зниження відображає новий класифікатор безпеки Anthropic, який спрямовує більшість завдань з кодування на Claude Opus 4.8, а не деградацію моделі. З 12 завдань налагодження лише три потрапили до Fable 5; класифікатор перехопив дев'ять за задумом, щоб запобігти джейлбрейк-експлойтам. Одночасне тестування людських уподобань Arena.AI серед тисяч сліпих голосів виявило, що продуктивність Fable 5 після відновлення залишилася майже незмінною: показники документів зросли на 34 пункти, а експертних текстів – на 25. Звичайні користувачі, які займаються творчим письмом, дослідженнями та аналізом, імовірно, помітять мінімальний вплив, тоді як розробники, що працюють із кодом, пов'язаним із безпекою, стикаються з частим резервним маршрутизуванням. Anthropic визнала, що класифікатори наразі закидають надто широку сітку, але не надала термінів удосконалення.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

21год тому

Claude розслідує аномалії в кількох моделях 4 липня

07-03 21:11

Claude Fable 5 демонструє падіння продуктивності на бенчмарках, але Класифікатор безпеки — а не Модель — звинувачують у збоях маршрутизації.

07-03 06:13

Alibaba забороняє всі продукти Anthropic, вимагає від співробітників видалити Claude до 10 липня

07-03 02:57

Fable 5 зазнає значного падіння продуктивності після перезапуску 3 липня

07-02 08:01

B.AI відновлює підтримку API Claude Fable 5 з 2 липня з двохканальним доступом

Поглиблений аналіз