Натан Ламберт обвинил Claude Fable 5 в «закулисном снижении интеллекта», а коммерческие клиенты переключились на сторону открытого исходного кода

Claude Fable 5暗箱降智

Исследователь машинного обучения Натан Ламберт 9 июня раскритиковал Anthropic Claude Fable 5, заявив, что модель ограничивает качество ответов на запросы по ИИ-технологиям, включая предобучающие конвейеры, распределённое обучение и проектирование чипов, без уведомления пользователей. Параллельно Anthropic принудительно внедряет требование об удержании данных сроком на 30 дней для коммерческого API и корпоративной версии трафика.

Подтверждённая критика Натана Ламберта: «искусственно созданное рассогласование выравнивания»

В своей статье Натан Ламберт формулирует следующие конкретные претензии:

Оценочная критика: при отсутствии информирования пользователей Ламберт утверждает, что компания молча снижает качество выводов модели; он приравнивает это к «искусственно созданному рассогласованию выравнивания (intentionally created misalignment)»

Ограничиваемые типы запросов: вопросы в области ИИ-технологий, включая предобучающие конвейеры, распределённое обучение и проектирование чипов

Критика правил безопасности: Ламберт считает, что соответствующие правила безопасности в основном работают как коммерческая защита, мешающая технике «технологической перегонки» (steaming) в открытом исходном коде, однако меры против злонамеренного «джейлбрейка» ограничены; при этом они препятствуют нормальным академическим исследованиям

Критика Ламберта выступает как позиция внешней независимой оценки; на момент публикации Anthropic официально не дала публичного ответа на указанные конкретные обвинения.

Конфликт по соглашению ZDR: подтверждённое изменение политики хранения данных

Чтобы отслеживать атаки с целью «джейлбрейка», Anthropic вводит требование об удержании данных в течение 30 дней для коммерческого API и корпоративного трафика. Эта политика вступает в конфликт с частью компаний, ранее придерживавшихся соглашения ZDR (zero data retention — нулевая утилизация данных), которое позволяет компаниям использовать API Anthropic без хранения каких-либо данных диалогов.

Само изменение политики Anthropic является подтверждённым фактом; названия конкретных пострадавших корпоративных клиентов и их официальные заявления на данный момент не имеют доступных публичных записей, которые можно было бы независимо проверить.

Законопроект HALO: подтверждённые условия и план законотворчества, объявленные сенатором Шиффом

Согласно сообщению пресс-службы сенатора Шиффа, законопроект HALO уже подтвердил следующие условия, включая: любые действия автономных оружейных систем требуют окончательного решения человека-командующего; обязательное подробное документирование процесса принятия военных решений и выбора целей; создание механизмов защиты информаторов; запрет на использование ИИ в определённых ситуациях, связанных с ядерным оружием и масштабной слежкой.

По сообщениям, сенатор Шифф планирует подать законопроект HALO как поправку к «Закону о разрешениях на оборону» (NDAA), который должен быть принят до конца 2026 года. Также сенатор штата Нью-Йорк Кирстен Гиллибранд и сенатор штата Мичиган Эллиса Слоткин, как сообщается, внесли законопроекты с похожими целями — оба планируется подать в виде поправок к NDAA; все три законопроекта пока не одобрены законодательными органами.

Пентагон и бэкграунд Anthropic: срыв контракта и оценка рисков цепочки поставок

Сообщается, что ранее Пентагон расторг контракт с Anthropic из-за того, что Anthropic отказалась убрать защитные меры, направленные на недопущение использования модели для масштабной внутренней слежки и для разработки полностью автономного оружия. После этого Пентагон заключил контракты с OpenAI, Google, Nvidia, SpaceX, Microsoft и AWS. Anthropic подала иск по факту включения её в перечень рисков цепочки поставок; дело всё ещё рассматривается.

Частые вопросы

Что именно имеется в виду под критикой Натана Ламберта в адрес Claude Fable 5 за «молчаливое снижение способности»?

В своей статье Ламберт утверждает, что Claude Fable 5, не отправляя пользователям каких-либо видимых уведомлений, молча ограничивает качество ответов на запросы, связанные с технологиями для исследований ИИ, и называет это «искусственно созданным рассогласованием выравнивания». Его утверждение — это позиция внешней независимой оценки; Anthropic не дала официального ответа на эти конкретные обвинения.

Что такое соглашение ZDR (zero data retention — нулевая утилизация данных) и как изменения политики влияют на корпоративных клиентов?

Соглашение ZDR позволяет компаниям использовать коммерческий API без хранения каких-либо данных диалогов, что подходит для сценариев, где особенно важна конфиденциальность. Новое требование Anthropic о принудительном хранении в течение 30 дней конфликтует с такими соглашениями. Названия конкретных пострадавших клиентов и их официальные заявления на данный момент не имеют публичных записей, которые можно было бы независимо проверить.

Какой сейчас прогресс по законопроекту HALO?

Законопроект HALO объявлен сенатором Шиффом и планируется как поправка к NDAA; NDAA должно быть принято до конца 2026 года. Три демократических сенатора (Шифф, Гиллибранд, Слоткин) планируют продвигать законопроект в формате поправки к NDAA, но все три законопроекта пока не получили одобрения со стороны законодательных органов.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев