Mensagem do Gate News, 29 de abril — Os investigadores da OpenAI, Sébastien Bubeck e Ernest Ryu, afirmam que os sistemas de IA poderiam executar a maior parte do trabalho de investigação humana no prazo de dois anos, apresentando a matemática como uma medida clara do progresso da IA. Ao contrário de testes de desempenho pouco concretos, os problemas matemáticos oferecem uma verificação precisa: as respostas são ou correctas ou incorrectas, sem espaço para ambiguidades.

Bubeck salientou que o verdadeiro raciocínio por IA exige resistir a longas cadeias de raciocínio. Um único erro num argumento multi-etapas colapsa toda a prova, tornando a detecção e correcção de erros no meio do processo o objectivo final para modelos avançados. Os laboratórios internos da OpenAI já geraram mais de dez teoremas completamente novos, publicáveis em revistas de combinatória de topo, demonstrando que a IA já produz trabalho genuinamente original e inovador, para além de simplesmente recombinar artigos existentes.

No entanto, avanços científicos sustentados exigem foco constante ao longo de semanas de testes. Os sistemas actuais ainda requerem supervisão humana rigorosa para orientar e verificar cada mudança de direcção. Bubeck usa "tempo de AGI" para medir durante quanto tempo um modelo consegue imitar autonomamente o pensamento humano; os sistemas actuais operam a cerca de dias a uma semana, com a meta da indústria a ser de semanas ou meses para permitir trabalho autónomo em áreas como a biologia.

A memória de longo prazo é crucial para este futuro. As janelas de chat padrão limitam a profundidade — as provas matemáticas complexas muitas vezes excedem 50 páginas — enquanto os repositórios de código demonstram como sessões de trabalho prolongadas permitem uma resolução mais profunda de problemas. À medida que a IA ganha independência e memória, a perícia humana torna-se mais valiosa, não menos. Os trabalhadores têm de reter o conhecimento profundo e de base para desafiar e verificar as respostas da máquina, e as organizações terão de criar novos filtros automatizados e sistemas de reputação para manter a confiança perante um dilúvio de investigação assistida por IA.

Ver fonte

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.

Notícias relacionadas

04-29 03:35

Relatório da a16z Crypto: Agentes de IA Alcançam uma Taxa de Sucesso de Até 70% na Exploração de Vulnerabilidades de Manipulação de Preços DeFi Com Conhecimento Estruturado

04-28 18:52

Avaliação da Anthropic atinge $1 Biliões, ultrapassando a OpenAI nos mercados secundários

04-28 08:31

Adobe lança o Firefly AI Assistant com fluxos de trabalho multi-app e integra o Claude

04-27 09:11

Greg Brockman da OpenAI: A IA a mudar de chat para execução autónoma de tarefas

04-27 05:17

GPT-5.5 Regressa ao Estado da Arte na Codificação, mas a OpenAI Muda os Benchmarks Depois de Perder para o Opus 4.7

Análise aprofundada