Claude Code memenangkan perlombaan hackathon dengan riset otomatisasi! Pemenang: Saya bahkan tidak tahu bagaimana cara menangnya

Di dalam Autoresearch Hackathon yang diselenggarakan oleh Paradigm, seorang peserta yang hampir “tidak merancang strategi secara langsung”, namun akhirnya meraih juara. Pemenang Ryan Li yang sekaligus merupakan CEO SurfAI mengatakan bahwa seluruh proses pemecahan masalah hampir sepenuhnya dikerjakan oleh AI; ia bahkan “tidak tahu bagaimana bisa menang”, namun tetap meraih peringkat pertama dalam Prediction Market Challenge.

Kompetisi ini meminta peserta untuk merancang strategi market making di pasar prediksi biner simulasi, menyediakan likuiditas pada order book melalui limit order, dan menyeimbangkan profit antara “arbitrager” dan “arus likuiditas ritel”. Peringkat akhir dihitung berdasarkan rata-rata edge (keunggulan profit) strategi dalam 200 kali simulasi acak. Hasil akhir Ryan adalah mean edge sebesar 42.32 dolar (dihitung dari median di tiga set seed acak), dan setelah penilaian ulang ia naik ke posisi teratas.

Riset otomatis Claude Code + Codex, menghasilkan 1.039 strategi

Berbeda dari perdagangan kuantitatif tradisional atau strategi market making yang bergantung pada penyesuaian parameter dan pemodelan oleh ahli manusia, Ryan mengambil pendekatan “Bitter Lesson” yang diajukan Rich Sutton dalam beberapa tahun terakhir—membiarkan daya komputasi dan skala pencarian mengalahkan pengalaman manusia. Ia mengubah seluruh masalah menjadi alur “riset otomatis” (autoresearch), mengeksplorasi ruang solusi secara paralel melalui beberapa agent AI, bukan mengoptimalkan secara manual.

Dalam proses ini, ia menggunakan 8 hingga 20 agent AI yang berjalan paralel (terutama berbasis pada Claude Code, dan dilengkapi dengan Codex). Setiap agent bertanggung jawab pada asumsi dan ruang parameter yang berbeda, terus menghasilkan strategi, menjalankan simulasi, dan melaporkan hasil. Pada akhirnya, terkumpul output 1.039 varian strategi, melakukan lebih dari 2.000 evaluasi, serta secara otomatis menghasilkan 47 skrip pemindaian parameter. Secara keseluruhan, skala pencariannya—setara dengan mengompresi eksperimen manual selama beberapa minggu menjadi beberapa jam saja.

Algoritma market making Python sepanjang 900 baris dari keluaran AI meraih juara hackathon

Pada level strategi, solusi yang akhirnya menang adalah algoritma market making berbasis Python sekitar 900 baris. Logika intinya bukan berasal dari satu desain tunggal, melainkan gabungan modul-modul berbeda yang “terbukti efektif”. Termasuk menghindari zona spread yang sangat sempit yang membuat arbitrager pasti menang, mengestimasi harga sebenarnya melalui teori informasi, menyesuaikan ukuran penawaran secara dinamis berdasarkan risiko arbitrase, serta masuk secara proaktif ketika order book lawan dikosongkan untuk merebut segmen dengan profit tinggi.

Perubahan paling kunci berasal dari sebuah agent AI yang “sepenuhnya meninggalkan strategi yang sudah ada, mulai dari nol”. Ketika optimasi macet pada sekitar +25 edge, agent tersebut secara mandiri menemukan model sizing yang berpusat pada “probabilitas risiko arbitrase”, sehingga performa strategi melonjak hingga +44; ini menjadi titik balik dalam seluruh pertandingan. Hasil ini juga langsung membuktikan metodologi Ryan: ketika pencarian terjebak dalam optimum lokal, memulai ulang lebih efektif daripada sekadar menyetel halus.

Keunggulan absolut riset AI: uji coba otomatis

Dalam ringkasannya, Ryan menyatakan bahwa kunci dari kompetisi ini bukanlah merancang “strategi yang cerdas”, melainkan membangun sistem yang mampu melakukan pencarian berskala besar, memvalidasi, dan menyingkirkan ide-ide. Daripada mengandalkan intuisi manusia, lebih baik membiarkan AI mencoba-coba di ruang solusi yang sangat luas, lalu memperbesar efisiensi melalui paralelisme dan otomatisasi.

Kasus ini juga semakin memperkuat peralihan peran “Agentic AI” dalam proses engineering dan riset: AI tidak lagi sekadar alat bantu, tetapi dapat langsung menjadi unit pelaksana inti untuk eksplorasi dan pengambilan keputusan. Dalam beberapa masalah yang sangat terstruktur dan dapat disimulasikan, manusia bahkan dapat sepenuhnya keluar dari posisi “pemecah”, lalu alih-alih merancang kerangka pencarian dan mekanisme evaluasi itu sendiri.

Artikel ini: Claude Code riset otomatis meraih juara hackathon! Pemenang: Saya benar-benar tidak tahu bagaimana cara menang! Pertama kali muncul di 鏈新聞 ABMedia.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Polymarket meninjau proyek rintisan dalam ekosistemnya, memberantas perdagangan orang dalam dan tindakan manipulasi pasar

Polymarket mengumumkan audit terhadap sebagian proyek rintisan yang terhubung, yang dituduh memanfaatkan informasi dari akun perdagangan orang dalam yang diduga untuk mengarahkan pengguna agar melakukan transaksi. Langkah ini bertujuan untuk memperkuat manajemen kepatuhan, sebagai respons terhadap perhatian publik terhadap risiko perdagangan orang dalam.

GateNews11menit yang lalu

Dorong inovasi! Hakim AS melarang pasar prediksi yang diatur oleh negara bagian Arizona, menghentikan penuntutan terhadap Kalshi

Pengadilan Distrik Federal AS memutuskan untuk melarang negara bagian Arizona menggunakan Undang-Undang Perjudian untuk menuntut platform pasar prediksi Kalshi, dengan alasan bahwa Komisi Perdagangan Berjangka Komoditas AS memiliki yurisdiksi eksklusif. Keputusan tersebut memengaruhi batas kewenangan pengawasan pasar keuangan antara negara bagian dan pemerintah federal, sementara Kalshi tetap berpendapat bahwa bisnisnya termasuk instrumen keuangan, bukan perjudian tradisional. Keputusan tiap negara bagian terhadap pasar prediksi tidak seragam, dan keluarga Trump juga menyatakan dukungan terhadap pasar prediksi.

CryptoCity2jam yang lalu

Dukung inovasi! Hakim AS melarang pasar prediksi yang diawasi oleh negara bagian Arizona, menghentikan penuntutan terhadap Kalshi

Pengadilan Distrik Federal AS memutuskan untuk melarang negara bagian Arizona menuntut platform pasar prediksi Kalshi berdasarkan undang-undang perjudian, dengan alasan bahwa Komisi Perdagangan Berjangka Komoditas AS memiliki yurisdiksi eksklusif. Keputusan ini memengaruhi batas kewenangan pengawasan antara negara bagian dan pemerintah federal dalam pasar keuangan, sementara Kalshi bersikeras bahwa bisnisnya termasuk produk keuangan, bukan perjudian tradisional. Putusan antarnegara bagian mengenai pasar prediksi tidak seragam, dan keluarga Trump juga menyatakan dukungannya untuk pasar prediksi.

CryptoCity5jam yang lalu

Taruhan Dompet Baru $40K pada Pengumuman Gencatan Senjata Iran Trump, Turun 85%

Pesan Berita Gerbang: sebuah dompet baru bernama "bullseye123" menghabiskan $40K untuk bertaruh bahwa Trump akan mengumumkan berakhirnya gencatan senjata AS-Iran pada 15 atau 18 April. Pemegang dompet saat ini sedang rugi $34K, yang mewakili kerugian 85% pada posisi tersebut.

GateNews6jam yang lalu

Dorong inovasi! Hakim AS melarang pengadilan prediksi pasar yang diawasi Arizona, menangguhkan penuntutan terhadap Kalshi

Pengadilan Distrik Federal Amerika Serikat memutuskan untuk melarang Arizona menggunakan Undang-Undang Perjudian untuk menuntut platform pasar prediksi Kalshi, dengan alasan bahwa Komisi Perdagangan Berjangka Komoditas Federal memiliki yurisdiksi eksklusif. Putusan ini memengaruhi batas kewenangan negara bagian dan federal dalam pengawasan pasar keuangan, sementara Kalshi bersikukuh bahwa bisnisnya termasuk dalam instrumen keuangan, bukan perjudian tradisional. Penetapan keputusan berbagai negara bagian mengenai pasar prediksi tidak seragam, dan Keluarga Trump juga menyatakan dukungannya terhadap pasar prediksi.

CryptoCity8jam yang lalu

Y Combinator pertama kali melakukan pendanaan dengan stablecoin, membayar Totalis sebesar 500.000 dolar AS USDC

Y Combinator pertama kali melakukan investasi dalam stablecoin sepenuhnya melalui jaringan Solana, membayar Totalis—sebuah startup pasar prediksi—sebesar 500.000 dolar AS dalam USDC, dan berencana membuka opsi pembayaran stablecoin untuk semua startup yang didukung. Totalis akan menggunakan platform tersebut untuk menjalankan perdagangan stablecoin dan mata uang fiat.

GateNews9jam yang lalu
Komentar
0/400
Tidak ada komentar