O Claude Code conquista o primeiro lugar na maratona de hackers com investigação de automação! Vencedor: eu nem sequer sabia como vencer

No Hackathon de Autoresearch organizado pela Paradigm, um(a) participante que, praticamente, não “concebeu estratégias pessoalmente”, acabou por vencer o torneio. O vencedor Ryan Li, que também é CEO da SurfAI, afirma que todo o processo de resolução ficou quase totalmente a cargo da IA, que ele próprio “nem sabe como é que venceu”, e ainda assim conseguiu o primeiro lugar no Prediction Market Challenge.

Esta competição exige que os participantes desenhem uma estratégia de market making num mercado de previsão binário simulado, fornecendo liquidez no livro de ordens através de ordens limitadas e equilibrando o lucro entre “arbitradores” e o fluxo de retalho. A classificação final é calculada com base na edge média (vantagem de lucro) em 200 simulações aleatórias. O resultado final de Ryan foi de 42,32 USD de mean edge (calculado pela mediana de três grupos de sementes aleatórias) e, após a reavaliação, subiu ao primeiro lugar.

Claude Code + Codex pesquisa automática, produz 1.039 estratégias

Ao contrário das estratégias de trading quantitativo tradicional ou de market making que dependem de ajustes e modelação por especialistas humanos, Ryan adoptou a abordagem do “Bitter Lesson” proposta por Rich Sutton nos últimos anos, fazendo com que a capacidade de computação e o tamanho da pesquisa superem a experiência humana. Ele transformou todo o problema num processo de “pesquisa automatizada” (autoresearch), explorando em paralelo o espaço de possíveis soluções por meio de múltiplos agentes de IA, em vez de optimização manual.

Durante todo o processo, ele utilizou entre 8 e 20 agentes de IA em execução paralela (principalmente com base em Claude Code, com apoio do Codex). Cada agente ficou responsável por diferentes hipóteses e espaços de parâmetros, gerando continuamente estratégias, executando simulações e devolvendo os resultados. No fim, acumulou a produção de 1.039 variações de estratégias, realizou mais de 2.000 avaliações e gerou automaticamente 47 scripts de varrimento de parâmetros. O tamanho global da pesquisa, por outras palavras, equivale a comprimir semanas de experiências manuais para apenas algumas horas.

Algoritmo de market making em Python com 900 linhas gerado por IA conquista o primeiro lugar no hackathon

Ao nível da estratégia, a solução final vencedora é um algoritmo de market making com cerca de 900 linhas de Python; a lógica central não provém de um único desenho, mas sim da combinação de múltiplos módulos “validados como eficazes”. Inclui evitar zonas de spread extremamente estreitas em que os arbitradores ganham de forma definitiva, estimar o preço real através da teoria da informação, ajustar dinamicamente a dimensão da cotação com base no risco de arbitragem e entrar proactivamente no mercado para conquistar zonas de maior lucro quando as ordens do livro do adversário forem “comidas” (consumidas).

A突破 mais crítica, no entanto, vem de um agente de IA que, pela primeira vez, “abandona totalmente estratégias existentes e começa do zero”. Quando a optimização estagnou em cerca de +25 edge, esse agente descobriu de forma independente um modelo de sizing com base na “probabilidade de risco de arbitragem”, elevando o desempenho da estratégia de uma só vez para +44, tornando-se o ponto de viragem de toda a competição. Este resultado também valida directamente a metodologia de Ryan: quando a pesquisa fica presa num ótimo local, reiniciar é mais eficaz do que afinar.

A vantagem absoluta da pesquisa em IA: tentativas automatizadas

Na conclusão, Ryan indica que o ponto-chave desta competição não é conceber uma “estratégia inteligente”, mas sim construir um sistema que consiga fazer uma pesquisa em grande escala, validar ideias e eliminá-las. Em vez de depender da intuição humana, deixa-se que a IA faça tentativas num enorme espaço de soluções e se aumente a eficiência através da paralelização e da automatização.

Este caso reforça ainda mais a mudança do papel da “Agentic AI” nos processos de engenharia e de investigação: a IA deixa de ser apenas uma ferramenta de apoio e pode assumir directamente a unidade principal de execução para exploração e tomada de decisão. Em alguns problemas altamente estruturados e simuláveis, os humanos podem até sair completamente do papel de “resolvedores” e, em vez disso, desenhar a própria estrutura de pesquisa e os mecanismos de avaliação.

Este artigo: a pesquisa automatizada do Claude Code vence o hackathon! Vencedor: eu literalmente não sei como é que ganhei, apareceu pela primeira vez em 鏈新聞 ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Incentivar a inovação! Juiz dos EUA e da França proíbe os mercados de previsão supervisionados pelo estado do Arizona e suspende o processo contra a Kalshi

O tribunal distrital federal dos EUA decidiu proibir o estado do Arizona de processar a plataforma de mercados de previsão Kalshi ao abrigo da lei sobre jogos de azar, considerando que a Comissão Federal de Negociação de Futuros de Produtos (CFTC) tem jurisdição exclusiva. Esta decisão afeta a linha de separação entre as competências dos estados e do governo federal na regulamentação dos mercados financeiros, enquanto a Kalshi mantém que o seu negócio se enquadra em instrumentos financeiros e não em apostas tradicionais. As decisões dos estados relativamente aos mercados de previsão não são uniformes, e a família de Trump também manifestou apoio a estes mercados.

CryptoCity1h atrás

O Trader da Polymarket Transforma $500 em $252K Depois de o UFC Cometer Mais Um Erro de Pontuação

Em breve Um trader da Polymarket afastou-se com $252,000 de lucro depois de o UFC ter identificado incorrectamente o vencedor de uma luta pela segunda vez em duas semanas. Uma conta X ligada ao trader da Polymarket disse que tinham notado o erro ao consultar a folha de pontuação oficial do combate. O

Decrypt1h atrás

Polymarket avalia projectos em fase inicial no ecossistema, combate transacções com informação privilegiada e comportamentos de manipulação de mercado

A Polymarket anunciou a realização de auditorias a alguns projectos de arranque ligados, alegadamente por utilizarem informações de contas suspeitas de negociação com base em informação privilegiada para orientar as operações dos utilizadores. Esta medida tem como objectivo reforçar a gestão de conformidade e responder às preocupações do público quanto ao risco de negociação com base em informação privilegiada.

GateNews2h atrás

Incentivar a inovação! Juiz dos EUA e da França proíbe o regulamento de mercados de previsão pelo estado do Arizona, suspendendo a acusação contra a Kalshi

Um tribunal distrital federal dos EUA decidiu proibir o estado do Arizona de processar a plataforma de mercados de previsão Kalshi ao abrigo da lei dos jogos, considerando que a Comissão de Negociação de Futuros de Mercadorias dos EUA tem jurisdição exclusiva. Esta decisão afecta a linha de fronteira entre as competências estaduais e federais na supervisão dos mercados financeiros, e a Kalshi insiste em que a sua actividade se enquadra em instrumentos financeiros e não em jogos de fortuna e azar tradicionais. As decisões dos estados sobre os mercados de previsão não são uniformes, e a família Trump também manifestou apoio aos mercados de previsão.

CryptoCity4h atrás

Incentiva a inovação! Juízes dos EUA e da França proíbem a regulamentação dos mercados de previsão do estado do Arizona, suspendem o processo contra a Kalshi

O tribunal distrital federal dos EUA decidiu impedir que o estado do Arizona processe a plataforma de mercados de previsão Kalshi ao abrigo da lei sobre jogos, considerando que a Comissão de Valores Mobiliários e da Bolsa de Mercadorias dos EUA tem jurisdição exclusiva. Esta decisão afecta a linha divisória entre as competências estaduais e federais na supervisão dos mercados financeiros, enquanto a Kalshi insiste que o seu negócio se enquadra em produtos financeiros e não em jogos de azar tradicionais. As decisões dos vários estados sobre os mercados de previsão não são uniformes, e a família Trump também já manifestou apoio aos mercados de previsão.

CryptoCity7h atrás

Nova carteira aposta $40K no anúncio de cessar-fogo entre Trump e o Irão, abaixo 85%

Mensagem de notícias da Gate: uma carteira recém-criada chamada "bullseye123" gastou $40K ao apostar que Trump irá anunciar o fim do cessar-fogo EUA-Irão até 15 de abril ou 18 de abril. O detentor da carteira encontra-se atualmente com menos $34K, o que representa uma perda de 85% na posição.

GateNews9h atrás
Comentário
0/400
Sem comentários