O Claude Code conquista o primeiro lugar na maratona de hackers com investigação de automação! Vencedor: eu nem sequer sabia como vencer

No Hackathon de Autoresearch organizado pela Paradigm, um(a) participante que, praticamente, não “concebeu estratégias pessoalmente”, acabou por vencer o torneio. O vencedor Ryan Li, que também é CEO da SurfAI, afirma que todo o processo de resolução ficou quase totalmente a cargo da IA, que ele próprio “nem sabe como é que venceu”, e ainda assim conseguiu o primeiro lugar no Prediction Market Challenge.

Esta competição exige que os participantes desenhem uma estratégia de market making num mercado de previsão binário simulado, fornecendo liquidez no livro de ordens através de ordens limitadas e equilibrando o lucro entre “arbitradores” e o fluxo de retalho. A classificação final é calculada com base na edge média (vantagem de lucro) em 200 simulações aleatórias. O resultado final de Ryan foi de 42,32 USD de mean edge (calculado pela mediana de três grupos de sementes aleatórias) e, após a reavaliação, subiu ao primeiro lugar.

Claude Code + Codex pesquisa automática, produz 1.039 estratégias

Ao contrário das estratégias de trading quantitativo tradicional ou de market making que dependem de ajustes e modelação por especialistas humanos, Ryan adoptou a abordagem do “Bitter Lesson” proposta por Rich Sutton nos últimos anos, fazendo com que a capacidade de computação e o tamanho da pesquisa superem a experiência humana. Ele transformou todo o problema num processo de “pesquisa automatizada” (autoresearch), explorando em paralelo o espaço de possíveis soluções por meio de múltiplos agentes de IA, em vez de optimização manual.

Durante todo o processo, ele utilizou entre 8 e 20 agentes de IA em execução paralela (principalmente com base em Claude Code, com apoio do Codex). Cada agente ficou responsável por diferentes hipóteses e espaços de parâmetros, gerando continuamente estratégias, executando simulações e devolvendo os resultados. No fim, acumulou a produção de 1.039 variações de estratégias, realizou mais de 2.000 avaliações e gerou automaticamente 47 scripts de varrimento de parâmetros. O tamanho global da pesquisa, por outras palavras, equivale a comprimir semanas de experiências manuais para apenas algumas horas.

Algoritmo de market making em Python com 900 linhas gerado por IA conquista o primeiro lugar no hackathon

Ao nível da estratégia, a solução final vencedora é um algoritmo de market making com cerca de 900 linhas de Python; a lógica central não provém de um único desenho, mas sim da combinação de múltiplos módulos “validados como eficazes”. Inclui evitar zonas de spread extremamente estreitas em que os arbitradores ganham de forma definitiva, estimar o preço real através da teoria da informação, ajustar dinamicamente a dimensão da cotação com base no risco de arbitragem e entrar proactivamente no mercado para conquistar zonas de maior lucro quando as ordens do livro do adversário forem “comidas” (consumidas).

A突破 mais crítica, no entanto, vem de um agente de IA que, pela primeira vez, “abandona totalmente estratégias existentes e começa do zero”. Quando a optimização estagnou em cerca de +25 edge, esse agente descobriu de forma independente um modelo de sizing com base na “probabilidade de risco de arbitragem”, elevando o desempenho da estratégia de uma só vez para +44, tornando-se o ponto de viragem de toda a competição. Este resultado também valida directamente a metodologia de Ryan: quando a pesquisa fica presa num ótimo local, reiniciar é mais eficaz do que afinar.

A vantagem absoluta da pesquisa em IA: tentativas automatizadas

Na conclusão, Ryan indica que o ponto-chave desta competição não é conceber uma “estratégia inteligente”, mas sim construir um sistema que consiga fazer uma pesquisa em grande escala, validar ideias e eliminá-las. Em vez de depender da intuição humana, deixa-se que a IA faça tentativas num enorme espaço de soluções e se aumente a eficiência através da paralelização e da automatização.

Este caso reforça ainda mais a mudança do papel da “Agentic AI” nos processos de engenharia e de investigação: a IA deixa de ser apenas uma ferramenta de apoio e pode assumir directamente a unidade principal de execução para exploração e tomada de decisão. Em alguns problemas altamente estruturados e simuláveis, os humanos podem até sair completamente do papel de “resolvedores” e, em vez disso, desenhar a própria estrutura de pesquisa e os mecanismos de avaliação.

Este artigo: a pesquisa automatizada do Claude Code vence o hackathon! Vencedor: eu literalmente não sei como é que ganhei, apareceu pela primeira vez em 鏈新聞 ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Incentiva a inovação! Juízes dos EUA e da França proíbem a regulamentação dos mercados de previsão do estado do Arizona, suspendem o processo contra a Kalshi

O tribunal distrital federal dos EUA decidiu impedir que o estado do Arizona processe a plataforma de mercados de previsão Kalshi ao abrigo da lei sobre jogos, considerando que a Comissão de Valores Mobiliários e da Bolsa de Mercadorias dos EUA tem jurisdição exclusiva. Esta decisão afecta a linha divisória entre as competências estaduais e federais na supervisão dos mercados financeiros, enquanto a Kalshi insiste que o seu negócio se enquadra em produtos financeiros e não em jogos de azar tradicionais. As decisões dos vários estados sobre os mercados de previsão não são uniformes, e a família Trump também já manifestou apoio aos mercados de previsão.

CryptoCity2m atrás

Nova carteira aposta $40K no anúncio de cessar-fogo entre Trump e o Irão, abaixo 85%

Mensagem de notícias da Gate: uma carteira recém-criada chamada "bullseye123" gastou $40K ao apostar que Trump irá anunciar o fim do cessar-fogo EUA-Irão até 15 de abril ou 18 de abril. O detentor da carteira encontra-se atualmente com menos $34K, o que representa uma perda de 85% na posição.

GateNews1h atrás

Incentivem a inovação! Um juiz dos EUA proíbe o regulador do mercado de previsões do estado do Arizona e suspende a acusação contra a Kalshi

O tribunal distrital federal dos EUA decidiu proibir o estado do Arizona de processar a plataforma de mercados de previsão Kalshi com base na lei de apostas, considerando que a Comissão Federal de Negociação de Futuros de Mercadorias tem jurisdição exclusiva. Esta decisão afeta as fronteiras entre as competências estaduais e federais na supervisão dos mercados financeiros; a Kalshi, por sua vez, insiste em que o seu negócio se enquadra em instrumentos financeiros e não em apostas tradicionais. As decisões dos estados sobre os mercados de previsão não são uniformes e a família de Trump também manifestou apoio aos mercados de previsão.

CryptoCity3h atrás

A Y Combinator realizou pela primeira vez uma ronda de financiamento em stablecoins, pagando à Totalis 500.000 dólares em USDC

A Y Combinator fez a sua primeira ronda de investimento 100% em stablecoins através da blockchain da Solana, pagando 500 mil dólares em USDC à empresa de mercados de previsão, Totalis, e planeia disponibilizar opções de pagamento em stablecoin para todas as startups apoiadas. A Totalis vai utilizar esta plataforma para executar transacções de stablecoin e de moeda fiduciária.

GateNews3h atrás

Plataforma de previsão Kalshi anuncia que irá lançar um novo produto a 27 de abril, a comunidade especula ou sugere a introdução de mercados de previsão perpétuos

Gate News mensagem, 14 de abril, a plataforma de previsão Kalshi publicou um vídeo teaser, anunciando que irá lançar um novo produto a 27 de abril. O vídeo mostra uma espiral verde que se vai formando progressivamente até criar um anel perpétuo, acabando por aparecer o texto "Timeless" (eterno). A comunidade especula que esta atualização pode estar relacionada com a introdução de um mercado de previsões perpétuo sem data de expiração, ultrapassando a limitação de prazo dos contratos de eventos originais da Kalshi e aumentando a flexibilidade de negociação.

GateNews3h atrás

Previsão das eleições presidenciais dos EUA de 2028: a taxa de apoio do vice-presidente atinge um novo mínimo, Vance continua a manter uma vantagem ténue

O mercado de previsões das eleições presidenciais dos EUA de 2028 já abriu, apesar de a taxa de aprovação do vice-presidente JD Vance ter descido para um valor mínimo histórico, continuando ainda em primeiro lugar nas principais plataformas. A quota de apoio líquida de Vance caiu para -18%, influenciada por factores como a inflação e os preços do petróleo. As dimensões das transacções na Polymarket e na Kalshi mostram que a concorrência continua intensa. Os analistas consideram que os dados das sondagens podem estar sujeitos a oscilações e que a situação futura permanece incerta.

MarketWhisper5h atrás
Comentar
0/400
Nenhum comentário