
Засновник OpenAI, Андрій Карпатьї (Andrej Karpathy), який у минулому місяці приєднався до Anthropic, 9 червня поділився своїми оцінками щодо Claude Fable 5, назвавши його стрибок у продуктивності, що має значення міжпоколінного переходу. Він описав вплив на продуктивність за допомогою метафори «програмне забезпечення ллється, як вода з крана». Втім Карпатьї чітко застерігає: не слід відмовлятися від код-рев’ю.
Підтвердження Карпатьї щодо здатності Fable 5
Версійний міжпоколінний стрибок продуктивності: Карпатьї підтвердив, що Fable 5 досяг міжпоколінного стрибка продуктивності, а його переваги особливо помітні під час обробки довших завдань. Він може ефективно виконувати складні інструкції майже без ручного втручання.
Складне налагодження для довгих ланцюжків: Карпатьї зазначив, що Fable 5 у разі зіткнення з масштабними цілями швидко вловлює задум і просувається самостійно. Вперше це викликало в нього сильне бажання повністю не дивитися на код.
Чітке застереження (пряма цитата Карпатьї): Він наголосив, що не можна в умовах продакшну повністю пропускати код-рев’ю — це його пряме попередження для користувачів.
Опис базової моделі (підтвердження Карпатьї): Карпатьї вказав, що Claude Fable 5 і Claude Mythos 5 використовують ту саму базову модель, а Fable 5 на цій основі доповнює додаткові заходи безпеки.
Парадокс Джефонса: аналітична рамка Карпатьї
У своїх коментарях Карпатьї зазначив, що коли доступне програмне забезпечення «ллється, як вода з крана», у домені софту спрацює «парадокс Джефонса» (Jevons Paradox).
Визначення парадоксу Джефонса: Після суттєвого зростання ефективності використання ресурсів, через істотне зниження витрат на використання, сукупний попит на цей ресурс не зменшується, а навпаки починає зростати експоненційно.
Прикладне пояснення Карпатьї (з коментаря на X): Він зазначив, що цей ефект змусить людей створювати багато «сверхспецифічних» (hyper-specific) інструментів для разового використання, а також величезні тестові набори, що в підсумку підштовхне експоненційне зростання загального попиту на програмне забезпечення.
Підтвердження проблем із механізмами безпеки
У своїх коментарях Карпатьї зазначив, що на старті випуску Claude Fable 5 конфігурація механізмів безпеки залишається надто чутливою і потребує подальшого доопрацювання. Ця оцінка узгоджується з поясненням Anthropic у повідомленні про запуск Fable 5: Anthropic визнає, що наявні заходи безпеки інколи дають хибні спрацювання нешкідливих запитів (загальний рівень тригерів — менше 5%), і заявляє, що працює над покращенням та якнайшвидшим зменшенням кількості хибних спрацювань.
Поширені запитання
Що означає «парадокс Джефонса», який згадав Карпатьї, для генерації AI-коду?
Згідно з коментарями Карпатьї на платформі X, коли AI робить собівартість виробництва програмного забезпечення близькою до нуля, попит на софт не знижується — натомість він зростає експоненційно. Він прогнозує, що це підштовхне розробників створювати більше високоспеціалізованих інструментів для разового використання та великі масштаби тестових наборів, збільшуючи загальні обсяги споживання програмного забезпечення.
Чому Карпатьї чітко застерігає не пропускати код-рев’ю повністю в продакшні?
Карпатьї зазначив, що хоча можливості Fable 5 вперше викликали в нього спонукання повністю не дивитися на код, він одночасно чітко попереджає: такий підхід не слід застосовувати в середовищі продакшну. Його застереження збігається з рекомендацією Anthropic — навіть сильні моделі мають потребу в ручному нагляді, щоб забезпечити надійність.
Яке конкретне бачення Карпатьї щодо механізмів безпеки Fable 5?
У своїх коментарях Карпатьї зазначив, що на старті випуску Fable 5 конфігурація механізмів безпеки є надто чутливою і потребує подальшого доопрацювання. У повідомленні Anthropic також підтверджено, що наразі заходи безпеки інколи дають хибні спрацювання нешкідливих запитів: рівень тригерів — менше 5%, і компанія заявляє, що продовжує покращення.