Автоматизація досліджень Claude Code здобула перемогу в хакатоні! Переможець: Взагалі не знаю, як це виграли

На Autoresearch Hackathon, який проводить Paradigm, учасник, який майже «не проєктував стратегії вручну», зрештою здобув перемогу. Переможець Ryan Li, який також є CEO SurfAI, зазначає, що весь процес розв’язання задачі майже повністю виконав AI: він навіть «не знає, як виграв», але все одно посів перше місце в Prediction Market Challenge.

Ці змагання вимагають від учасників розробити маркет-мейкерську стратегію на імітованому бінарному ринку прогнозів. За допомогою лімітних ордерів вони мають надавати ліквідність у стакані та досягати балансу прибутку між «арбітражниками» та «роздрібним потоком» (retail flow). Підсумкові позиції визначаються середнім edge (перевагою в прибутку) від стратегії в 200 випадкових симуляціях. Фінальний результат Ryan становив 42.32 долара mean edge (обчислено як медіана у трьох наборах випадкових seed), а після повторного оцінювання він піднявся на перше місце.

Claude Code + Codex автоматичне дослідження — 1039 стратегій

На відміну від традиційної кількісної торгівлі або маркет-мейкерських стратегій, які покладаються на участь людей-експертів для підстроювання та моделювання, Ryan застосував підхід «Bitter Lesson», запропонований Rich Sutton упродовж останніх років: обчислювальна потужність і масштаб пошуку мають перемогти людський досвід. Він перетворив всю задачу на процес «автоматизованого дослідження» (autoresearch), використовуючи кілька AI agent для паралельного пошуку в просторі рішень, а не ручну оптимізацію.

У процесі він задіяв від 8 до 20 паралельно запущених AI agent (переважно на основі Claude Code, із допомогою Codex). Кожен agent відповідав за власні припущення та параметричний простір: безперервно генерував стратегії, виконував симуляції, а потім звітував про результати. У підсумку він накопичив 1,039 варіантів стратегій, провів понад 2,000 оцінювань і автоматично згенерував 47 скриптів для параметричного сканування. Загальний масштаб пошуку — це фактично стиснення кількох тижнів ручних експериментів до кількох годин.

900 рядків Python від AI для алгоритму маркет-мейкінгу — перемога на хакатоні

На рівні стратегій фінальною переможною схемою стала маркет-мейкерська логіка приблизно з 900 рядків Python. Її ключова ідея не походить від одного-єдиного дизайну: це нашарування кількох модулів, які «підтвердили свою ефективність». Зокрема, він уникав надвузьких діапазонів цін, де арбітражники гарантовано виграють; оцінював реальну ціну через теорію інформації; динамічно коригував масштаби котирувань залежно від ризику арбітражу; а також активно заходив, коли ворожий стакан ордерів «висмоктували», щоб перехопити зони з вищим прибутком.

Найважливіший прорив прийшов із одного AI agent, який «повністю відкинув наявні стратегії та почав з нуля». Коли загальна оптимізація застопорилася приблизно на +25 edge, цей agent самостійно знайшов модель sizing, що спиралася на «ймовірність арбітражного ризику» як ключову основу. Це разом підняло результат стратегії до +44 і стало поворотним моментом усієї гри. Цей результат також безпосередньо підтвердив методологію Ryan: коли пошук застрягає в локальному оптимумі, перезапуск ефективніший, ніж точне доопрацювання.

Абсолютна перевага AI-досліджень: автоматизовані спроби й помилки

У підсумку Ryan зазначив, що ключ у цій грі не в тому, щоб придумати «розумну стратегію», а в тому, щоб створити систему, яка здатна масштабно здійснювати пошук, перевіряти та відсівати ідеї. Замість того щоб покладатися на людську інтуїцію, він дав AI можливість пробувати в величезному просторі рішень і підсилювати ефективність завдяки паралелізації та автоматизації.

Цей кейс також додатково підкреслив зміну ролі «Agentic AI» у інженерних і дослідницьких процесах: AI більше не просто допоміжний інструмент — він може прямо виконувати роль центрального виконавця для дослідження та ухвалення рішень. У деяких високоструктурованих і таких, що піддаються симуляції, задачах людина може навіть повністю вийти з позиції «розв’язувача» і натомість спроєктувати самі рамки пошуку та механізми оцінювання.

Ця стаття про те, як автоматизоване дослідження Claude Code здобуло перемогу на хакатоні! Переможець: «Я взагалі не знаю, як виграв» — вперше з’явилася в 鏈新聞 ABMedia.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

ProCap Financial співпрацює з Kalshi, щоб запропонувати сервіс дослідження на ринку прогнозів

Анотація: ProCap Financial, керівником якої є Ентоні Помпліано, співпрацює з Kalshi, щоб пропонувати дослідження на основі ШІ, використовуючи реальні дані Kalshi в рамках ProCap Insights. Послуга, перша, що ліцензує дані Kalshi платній дослідницькій фірмі, має на меті публікувати аналізи ринків, стратегії та сигнали неправильного ціноутворення на тлі змінного регулювання та пріоритетів правозастосування. Підсумок: Команди ProCap співпрацюють із Kalshi, щоб надавати керовані ШІ дослідження на ринку рішень, інтегруючи дані Kalshi; прагне виявляти неправильне ціноутворення, тенденції та стратегії на тлі змінного регулювання.

GateNews8хв. тому

Polymarket запускає функцію безстрокових ф’ючерсів із торгівлею з кредитним плечем

Polymarket запускає безстрокові ф’ючерси з кредитним плечем, розширюючися за межі стандартних ринків прогнозів; реєстрація на ранній доступ відкрита для торгів із кредитним плечем на його децентралізованій платформі. Ця стаття повідомляє, що Polymarket запустила функцію безстрокових ф’ючерсів, яка дає змогу торгувати прогнозами з кредитним плечем на своїй децентралізованій платформі, з відкритою реєстрацією на ранній доступ, розширюючи пропозиції поза межами традиційних ринків.

GateNews1год тому

Kalshi запустить торгівлю криптовалютними безстроковими ф’ючерсами

Новини Gate News: за даними The Information, платформа прогнозних ринків Kalshi планує запустити торговий бізнес із криптовалютами та запропонувати продукти з безстроковими ф’ючерсами.

GateNews2год тому

ProCap Financial співпрацює з Kalshi для запуску AI-підсиленої дослідницької послуги ринків прогнозів

Повідомлення Gate News, 21 квітня — ProCap Financial, заснована криптопідприємцем Ентоні Помпліано, співпрацює з Kalshi, оператором ринку прогнозів, щоб запустити дослідницьку послугу, орієнтовану на аналіз ринку прогнозів. Послуга використовує конвеєр даних Kalshi та AI-агенти ProCap, щоб

GateNews7год тому

Kalshi стикається з боротьбою в Верховному суді, оскільки волатильність інфляції підсилює попит на хеджування на ринках прогнозів

Kalshi та Polymarket можуть зіткнутися зі справою в Верховному суді щодо законності ринків прогнозів, тоді як інфляція зростає, а фондові ринки б’ють рекорди. Результат може змінити підхід трейдерів до хеджування економічних ризиків на тлі суперечливих судових рішень щодо їхньої діяльності.

GateNews04-20 19:02

Polymarket шукає $400M мільйони нового фінансування за оцінки в $15 мільярд

Polymarket шукає додаткові $400 мільйони фінансування після того, як залучив $600 мільйони за оцінки в $15 мільярд, що зросла з $9 мільярда минулого року. Незважаючи на таке зростання, компанія все ще відстає від конкурента Kalshi Inc., чиїй оцінці відповідає $22 мільярда.

GateNews04-20 18:31
Прокоментувати
0/400
Немає коментарів