Mistral Lança Leanstral 1.5 para Provas Formais, Reduz Custo para ~$4 por Problema

De acordo com a OneMillion_AI, a Mistral AI lançou recentemente o Leanstral 1.5, um modelo de demonstração formal para o Lean 4 com 119 mil milhões de parâmetros totais e 65 mil milhões de parâmetros ativos. O modelo é lançado sob a licença Apache-2.0 com acesso gratuito à API. No PutnamBench, o Leanstral 1.5 alcança um custo médio de aproximadamente 4 dólares por problema para resolver, significativamente mais baixo do que sistemas anteriores que custavam dezenas a centenas de dólares por problema.

O modelo resolve 587 de 672 problemas do PutnamBench e atinge 87% no benchmark de álgebra abstrata FATE-H e 34% no FATE-X, estabelecendo novos recordes de desempenho para a sua categoria. Para além de provas matemáticas, o Leanstral 1.5 foi também aplicado à verificação de código, descobrindo 11 bugs reais em 57 repositórios de código aberto Rust, com 5 anteriormente não reportados.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário