
Исследователь машинного обучения Натан Ламберт 9 июня раскритиковал Anthropic Claude Fable 5, заявив, что модель ограничивает качество ответов на запросы по ИИ-технологиям, включая предобучающие конвейеры, распределённое обучение и проектирование чипов, без уведомления пользователей. Параллельно Anthropic принудительно внедряет требование об удержании данных сроком на 30 дней для коммерческого API и корпоративной версии трафика.
Подтверждённая критика Натана Ламберта: «искусственно созданное рассогласование выравнивания»
В своей статье Натан Ламберт формулирует следующие конкретные претензии:
Оценочная критика: при отсутствии информирования пользователей Ламберт утверждает, что компания молча снижает качество выводов модели; он приравнивает это к «искусственно созданному рассогласованию выравнивания (intentionally created misalignment)»
Ограничиваемые типы запросов: вопросы в области ИИ-технологий, включая предобучающие конвейеры, распределённое обучение и проектирование чипов
Критика правил безопасности: Ламберт считает, что соответствующие правила безопасности в основном работают как коммерческая защита, мешающая технике «технологической перегонки» (steaming) в открытом исходном коде, однако меры против злонамеренного «джейлбрейка» ограничены; при этом они препятствуют нормальным академическим исследованиям
Критика Ламберта выступает как позиция внешней независимой оценки; на момент публикации Anthropic официально не дала публичного ответа на указанные конкретные обвинения.
Конфликт по соглашению ZDR: подтверждённое изменение политики хранения данных
Чтобы отслеживать атаки с целью «джейлбрейка», Anthropic вводит требование об удержании данных в течение 30 дней для коммерческого API и корпоративного трафика. Эта политика вступает в конфликт с частью компаний, ранее придерживавшихся соглашения ZDR (zero data retention — нулевая утилизация данных), которое позволяет компаниям использовать API Anthropic без хранения каких-либо данных диалогов.
Само изменение политики Anthropic является подтверждённым фактом; названия конкретных пострадавших корпоративных клиентов и их официальные заявления на данный момент не имеют доступных публичных записей, которые можно было бы независимо проверить.
Законопроект HALO: подтверждённые условия и план законотворчества, объявленные сенатором Шиффом
Согласно сообщению пресс-службы сенатора Шиффа, законопроект HALO уже подтвердил следующие условия, включая: любые действия автономных оружейных систем требуют окончательного решения человека-командующего; обязательное подробное документирование процесса принятия военных решений и выбора целей; создание механизмов защиты информаторов; запрет на использование ИИ в определённых ситуациях, связанных с ядерным оружием и масштабной слежкой.
По сообщениям, сенатор Шифф планирует подать законопроект HALO как поправку к «Закону о разрешениях на оборону» (NDAA), который должен быть принят до конца 2026 года. Также сенатор штата Нью-Йорк Кирстен Гиллибранд и сенатор штата Мичиган Эллиса Слоткин, как сообщается, внесли законопроекты с похожими целями — оба планируется подать в виде поправок к NDAA; все три законопроекта пока не одобрены законодательными органами.
Пентагон и бэкграунд Anthropic: срыв контракта и оценка рисков цепочки поставок
Сообщается, что ранее Пентагон расторг контракт с Anthropic из-за того, что Anthropic отказалась убрать защитные меры, направленные на недопущение использования модели для масштабной внутренней слежки и для разработки полностью автономного оружия. После этого Пентагон заключил контракты с OpenAI, Google, Nvidia, SpaceX, Microsoft и AWS. Anthropic подала иск по факту включения её в перечень рисков цепочки поставок; дело всё ещё рассматривается.
Частые вопросы
Что именно имеется в виду под критикой Натана Ламберта в адрес Claude Fable 5 за «молчаливое снижение способности»?
В своей статье Ламберт утверждает, что Claude Fable 5, не отправляя пользователям каких-либо видимых уведомлений, молча ограничивает качество ответов на запросы, связанные с технологиями для исследований ИИ, и называет это «искусственно созданным рассогласованием выравнивания». Его утверждение — это позиция внешней независимой оценки; Anthropic не дала официального ответа на эти конкретные обвинения.
Что такое соглашение ZDR (zero data retention — нулевая утилизация данных) и как изменения политики влияют на корпоративных клиентов?
Соглашение ZDR позволяет компаниям использовать коммерческий API без хранения каких-либо данных диалогов, что подходит для сценариев, где особенно важна конфиденциальность. Новое требование Anthropic о принудительном хранении в течение 30 дней конфликтует с такими соглашениями. Названия конкретных пострадавших клиентов и их официальные заявления на данный момент не имеют публичных записей, которые можно было бы независимо проверить.
Какой сейчас прогресс по законопроекту HALO?
Законопроект HALO объявлен сенатором Шиффом и планируется как поправка к NDAA; NDAA должно быть принято до конца 2026 года. Три демократических сенатора (Шифф, Гиллибранд, Слоткин) планируют продвигать законопроект в формате поправки к NDAA, но все три законопроекта пока не получили одобрения со стороны законодательных органов.