Натан Ламберт обвинил Claude Fable 5 в «закулисном снижении интеллекта», а коммерческие клиенты переключились на сторону открытого исходного кода

2026-06-10 05:12:46

Исследователь машинного обучения Натан Ламберт 9 июня раскритиковал Anthropic Claude Fable 5, заявив, что модель ограничивает качество ответов на запросы по ИИ-технологиям, включая предобучающие конвейеры, распределённое обучение и проектирование чипов, без уведомления пользователей. Параллельно Anthropic принудительно внедряет требование об удержании данных сроком на 30 дней для коммерческого API и корпоративной версии трафика.

Подтверждённая критика Натана Ламберта: «искусственно созданное рассогласование выравнивания»

В своей статье Натан Ламберт формулирует следующие конкретные претензии:

Оценочная критика: при отсутствии информирования пользователей Ламберт утверждает, что компания молча снижает качество выводов модели; он приравнивает это к «искусственно созданному рассогласованию выравнивания (intentionally created misalignment)»

Ограничиваемые типы запросов: вопросы в области ИИ-технологий, включая предобучающие конвейеры, распределённое обучение и проектирование чипов

Критика правил безопасности: Ламберт считает, что соответствующие правила безопасности в основном работают как коммерческая защита, мешающая технике «технологической перегонки» (steaming) в открытом исходном коде, однако меры против злонамеренного «джейлбрейка» ограничены; при этом они препятствуют нормальным академическим исследованиям

Критика Ламберта выступает как позиция внешней независимой оценки; на момент публикации Anthropic официально не дала публичного ответа на указанные конкретные обвинения.

Конфликт по соглашению ZDR: подтверждённое изменение политики хранения данных

Чтобы отслеживать атаки с целью «джейлбрейка», Anthropic вводит требование об удержании данных в течение 30 дней для коммерческого API и корпоративного трафика. Эта политика вступает в конфликт с частью компаний, ранее придерживавшихся соглашения ZDR (zero data retention — нулевая утилизация данных), которое позволяет компаниям использовать API Anthropic без хранения каких-либо данных диалогов.

Само изменение политики Anthropic является подтверждённым фактом; названия конкретных пострадавших корпоративных клиентов и их официальные заявления на данный момент не имеют доступных публичных записей, которые можно было бы независимо проверить.

Законопроект HALO: подтверждённые условия и план законотворчества, объявленные сенатором Шиффом

Согласно сообщению пресс-службы сенатора Шиффа, законопроект HALO уже подтвердил следующие условия, включая: любые действия автономных оружейных систем требуют окончательного решения человека-командующего; обязательное подробное документирование процесса принятия военных решений и выбора целей; создание механизмов защиты информаторов; запрет на использование ИИ в определённых ситуациях, связанных с ядерным оружием и масштабной слежкой.

По сообщениям, сенатор Шифф планирует подать законопроект HALO как поправку к «Закону о разрешениях на оборону» (NDAA), который должен быть принят до конца 2026 года. Также сенатор штата Нью-Йорк Кирстен Гиллибранд и сенатор штата Мичиган Эллиса Слоткин, как сообщается, внесли законопроекты с похожими целями — оба планируется подать в виде поправок к NDAA; все три законопроекта пока не одобрены законодательными органами.

Пентагон и бэкграунд Anthropic: срыв контракта и оценка рисков цепочки поставок

Сообщается, что ранее Пентагон расторг контракт с Anthropic из-за того, что Anthropic отказалась убрать защитные меры, направленные на недопущение использования модели для масштабной внутренней слежки и для разработки полностью автономного оружия. После этого Пентагон заключил контракты с OpenAI, Google, Nvidia, SpaceX, Microsoft и AWS. Anthropic подала иск по факту включения её в перечень рисков цепочки поставок; дело всё ещё рассматривается.

Частые вопросы

Что именно имеется в виду под критикой Натана Ламберта в адрес Claude Fable 5 за «молчаливое снижение способности»?

В своей статье Ламберт утверждает, что Claude Fable 5, не отправляя пользователям каких-либо видимых уведомлений, молча ограничивает качество ответов на запросы, связанные с технологиями для исследований ИИ, и называет это «искусственно созданным рассогласованием выравнивания». Его утверждение — это позиция внешней независимой оценки; Anthropic не дала официального ответа на эти конкретные обвинения.

Что такое соглашение ZDR (zero data retention — нулевая утилизация данных) и как изменения политики влияют на корпоративных клиентов?

Соглашение ZDR позволяет компаниям использовать коммерческий API без хранения каких-либо данных диалогов, что подходит для сценариев, где особенно важна конфиденциальность. Новое требование Anthropic о принудительном хранении в течение 30 дней конфликтует с такими соглашениями. Названия конкретных пострадавших клиентов и их официальные заявления на данный момент не имеют публичных записей, которые можно было бы независимо проверить.

Какой сейчас прогресс по законопроекту HALO?

Законопроект HALO объявлен сенатором Шиффом и планируется как поправка к NDAA; NDAA должно быть принято до конца 2026 года. Три демократических сенатора (Шифф, Гиллибранд, Слоткин) планируют продвигать законопроект в формате поправки к NDAA, но все три законопроекта пока не получили одобрения со стороны законодательных органов.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

2ч назад

Anthropic выпустила Claude Fable 5 с защитными мерами безопасности, обнаружено 10 тыс.+ уязвимостей

3ч назад

Anthropic сбрасывает пользовательские кредиты и запускает 13 июня мероприятие Build Day на $150 000 для Claude Fable 5

7ч назад

Anthropic запускает Claude Fable 5 с публичным доступом, цена — 10–50 долларов за 1 миллион токенов

Связанные статьи

Карапати: Claude Fable 5 — заставляет ПО литься как водопроводная вода, но предупреждает не отказываться от code review

Market Whisper2ч назад

Claude Fable 5 добавила механизм детектирования дистилляции, вероятность срабатывания ниже 5%

Market Whisper4ч назад

AI-модели Anthropic поднимают вопросы о безопасности DeFi из-за эксплойтов смарт-контрактов

Ethan Brooks4ч назад

Anthropic представила Claude Fable 5 — первый в своём роде ИИ-классификатор с автоматическим понижением уровня защитных ограждений

Market Whisper6ч назад

Anthropic запускает Claude Fable 5 с защитными ограничителями безопасности и Mythos 5 для правительства США

Oliver Grant12ч назад

комментарий

0/400

Нет комментариев