LISABench 2026 Primeira prova do ano, sete dos principais modelos de IA competem pelo título de rei na deteção de vulnerabilidades Web3

CoinNetwork

O site Coin界1 de janeiro de 2024 informa que, com a chegada de 2026, o campo de segurança de IA recebeu o seu primeiro teste de referência de peso. A LISABench anunciou hoje o lançamento da avaliação do primeiro trimestre de 2026, com o objetivo de determinar, através de testes práticos, qual o modelo de IA de ponta que apresenta o melhor desempenho na deteção de vulnerabilidades em contratos inteligentes Web3. Além disso, a LISABench lançou uma atividade de votação comunitária com prémios de previsão. A competição conta com um elenco de luxo, reunindo KIMI K2 (Moonshot AI), DeepSeek V3.2 (深度求索), QWen 3 30b-a3b (阿里云), GLM 4.6 (智谱 AI), GPT-5.2 (OpenAI), Gemini-3-pro-preview (Google) e Claude 4.5 Sonnet (Anthropic), os sete modelos de ponta mais avançados do mundo (Frontier Models) competem entre si. Atualmente, o canal de votação para prever o vencedor do Q1 já está aberto. Ao mesmo tempo, o repositório de código de padrão de avaliação da LISABench foi aberto no GitHub, para consulta e reprodução por desenvolvedores.

Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário