Pesquisadores da OpenAI: Sistemas de IA Podem Lidar com Grande Parte do Trabalho de Pesquisa em Dois Anos

Mensagem do Gate News, 29 de abril — Pesquisadores da OpenAI, Sébastien Bubeck e Ernest Ryu, dizem que sistemas de IA poderiam realizar a maior parte do trabalho de pesquisa humano dentro de dois anos, apresentando a matemática como uma medida clara do progresso da IA. Diferentemente de testes de desempenho vagos, problemas matemáticos oferecem uma verificação precisa: as respostas são ou corretas ou incorretas, sem espaço para ambiguidades.

Bubeck observou que o verdadeiro pensamento de IA exige sobreviver a longas cadeias de raciocínio. Um único erro em um argumento de múltiplas etapas derruba toda a prova, tornando detecção e correção de erros no meio do processo o objetivo final para modelos avançados. Os laboratórios internos da OpenAI já geraram mais de dez teoremas completamente novos, publicáveis em periódicos de combinatória de primeira linha, demonstrando que a IA agora produz trabalhos genuinamente originais e inovadores, além de simplesmente recombinar artigos existentes.

Entretanto, avanços científicos sustentados exigem foco constante ao longo de semanas de testes. Os sistemas atuais ainda requerem supervisão humana rigorosa para orientar e verificar cada mudança de direção. Bubeck usa “tempo de AGI” para medir por quanto tempo um modelo consegue imitar de forma independente o pensamento humano; os sistemas atuais operam em cerca de dias a uma semana, enquanto a meta da indústria é de semanas ou meses para permitir trabalho autônomo em áreas como a biologia.

A memória de longo prazo é crítica para esse futuro. Janelas padrão de chat limitam a profundidade — provas matemáticas complexas frequentemente excedem 50 páginas — enquanto repositórios de código demonstram como sessões de trabalho prolongadas possibilitam resolver problemas de forma mais profunda. À medida que a IA ganha independência e memória, a expertise humana se torna mais valiosa, não menos. Os trabalhadores precisam manter o conhecimento profundo e fundamental para desafiar e verificar respostas de máquinas, e as organizações precisarão de novos filtros automatizados e sistemas de reputação para manter a confiança em meio a uma avalanche de pesquisa assistida por IA.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Plataforma de IA Certifyde arrecada $2M na rodada seed com o CEO da Ripple Brad Garlinghouse

De acordo com o ChainCatcher, a plataforma de aplicativos de IA Certifyde anunciou a conclusão de uma rodada de financiamento seed de $2 milhões. Os investidores incluem K5 Global, Flamingo Capital e investidores-anjo como o CEO da Ripple, Brad Garlinghouse, o cofundador da Honey, George Ruan, e o cofundador da Nutra, Roland

GateNews1h atrás

DeepSeek Lança Recurso de Reconhecimento de Imagens em Testes Beta

De acordo com a PANews, a DeepSeek lançou hoje o seu recurso de reconhecimento de imagens (29 de abril), atualmente em testes beta. Usuários da versão web e do aplicativo móvel podem ser selecionados para o lançamento em beta.

GateNews2h atrás

Anthropic Lança 8 Conectores de Ferramentas Criativas para o Claude, Incluindo Blender, Adobe, Autodesk

A Anthropic anunciou uma suíte de conectores de ferramentas criativas que permitem que o Claude controle diretamente softwares profissionais usados por designers e músicos. Os oito conectores iniciais abrangem modelagem 3D, design visual, produção musical e apresentações ao vivo, com parceiros incluindo Blender, Adobe,

GateNews2h atrás

Casa Branca Contorna Avaliação de Risco do Pentágono para Implantar o Modelo Mythos da Anthropic em 29 de abril

De acordo com o Whale Factor, a Casa Branca está contornando a avaliação de risco do Pentágono para implantar o modelo Mythos, da Anthropic, em agências federais em 29 de abril. A medida visa acelerar as capacidades de IA do governo federal e acompanhar o ritmo das redes de IA descentralizadas. Isso representa uma mudança significativa

GateNews2h atrás

Cognizant vai adquirir a Astreya por $600M para expandir o negócio de infraestrutura de IA

De acordo com a Reuters, em 29 de abril, a Cognizant concordou em adquirir a Astreya por aproximadamente $600 milhões, à medida que expande seus negócios de infraestrutura de IA. A Astreya é uma provedora de serviços de TI especializada em infraestrutura de IA e serviços de data center. A operação deve ser concluída no segundo trimestre

GateNews3h atrás

30 Plugins Maliciosos no ClawHub Disfarçados de Ferramentas de IA, Baixados Mais de 9.800 Vezes

De acordo com o pesquisador da Manifold, Ax Sharma, 30 plugins no ClawHub disfarçados de ferramentas legítimas de IA foram baixados mais de 9.800 vezes enquanto, secretamente, convertiam as assistentes de IA dos usuários em trabalhadoras de criptomoedas. Os plugins, publicados sob a conta imaflytok, parecem como agendadores de tarefas e ferramentas de monitoramento rotineiros, mas contêm instruções ocultas que executam operações não autorizadas a

GateNews3h atrás
Comentário
0/400
Sem comentários