Anthropic сказав, що Mythos занадто сильний, щоб його відкривати. В результаті навіть малі моделі можуть відтворити більшість досягнень.


Одна безпекова компанія під назвою Aisle провела експеримент: використовуючи виявлені вразливості Mythos, що були відкрито продемонстровані, для їх відтворення за допомогою невеликих відкритих моделей.
Головна причина, чому Anthropic не публікує Mythos, — це "занадто небезпечно, якщо хакери отримають доступ, це спричинить катастрофу". Але якщо й малі моделі можуть робити щось подібне, то стратегія "не публікувати" сама по собі вже не має підстав.
Офіційна позиція Aisle: модель — це лише двигун, справжня здатність до атаки/захисту залежить від систем, побудованих навколо моделі — інструментарію, бази знань, середовища виконання.
Переглянути оригінал
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити