Mensagem do Gate News, 29 de abril — Os investigadores da OpenAI, Sébastien Bubeck e Ernest Ryu, afirmam que os sistemas de IA poderiam executar a maior parte do trabalho de investigação humana no prazo de dois anos, apresentando a matemática como uma medida clara do progresso da IA. Ao contrário de testes de desempenho pouco concretos, os problemas matemáticos oferecem uma verificação precisa: as respostas são ou correctas ou incorrectas, sem espaço para ambiguidades.
Bubeck salientou que o verdadeiro raciocínio por IA exige resistir a longas cadeias de raciocínio. Um único erro num argumento multi-etapas colapsa toda a prova, tornando a detecção e correcção de erros no meio do processo o objectivo final para modelos avançados. Os laboratórios internos da OpenAI já geraram mais de dez teoremas completamente novos, publicáveis em revistas de combinatória de topo, demonstrando que a IA já produz trabalho genuinamente original e inovador, para além de simplesmente recombinar artigos existentes.
No entanto, avanços científicos sustentados exigem foco constante ao longo de semanas de testes. Os sistemas actuais ainda requerem supervisão humana rigorosa para orientar e verificar cada mudança de direcção. Bubeck usa “tempo de AGI” para medir durante quanto tempo um modelo consegue imitar autonomamente o pensamento humano; os sistemas actuais operam a cerca de dias a uma semana, com a meta da indústria a ser de semanas ou meses para permitir trabalho autónomo em áreas como a biologia.
A memória de longo prazo é crucial para este futuro. As janelas de chat padrão limitam a profundidade — as provas matemáticas complexas muitas vezes excedem 50 páginas — enquanto os repositórios de código demonstram como sessões de trabalho prolongadas permitem uma resolução mais profunda de problemas. À medida que a IA ganha independência e memória, a perícia humana torna-se mais valiosa, não menos. Os trabalhadores têm de reter o conhecimento profundo e de base para desafiar e verificar as respostas da máquina, e as organizações terão de criar novos filtros automatizados e sistemas de reputação para manter a confiança perante um dilúvio de investigação assistida por IA.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
A plataforma de IA Certifyde angaria $2M em financiamento seed com o CEO da Ripple, Brad Garlinghouse
De acordo com a ChainCatcher, a plataforma de aplicações de IA Certifyde anunciou a conclusão de uma ronda de financiamento seed de $2 milhões. Os investidores incluem a K5 Global, a Flamingo Capital e investidores-anjo como o CEO da Ripple, Brad Garlinghouse, o cofundador da Honey, George Ruan, e o cofundador da Nutra, Roland
GateNews27m atrás
A DeepSeek Lança Recurso de Reconhecimento de Imagens em Fase de Testes Beta
De acordo com a PANews, a DeepSeek lançou hoje o seu recurso de reconhecimento de imagens (29 de Abril), actualmente em fase de testes beta. Tanto os utilizadores da versão web como da aplicação móvel poderão ser seleccionados para o lançamento em regime beta.
GateNews1h atrás
A Anthropic Lança 8 Conectores de Ferramentas Criativas para o Claude, Incluindo Blender, Adobe, Autodesk
A Anthropic anunciou um conjunto de conectores de ferramentas criativas que permitem que o Claude controle diretamente software profissional usado por designers e músicos. Os primeiros oito conectores abrangem modelação 3D, design visual, produção musical e atuações ao vivo, com parceiros incluindo Blender, Adobe,
GateNews1h atrás
Casa Branca contorna avaliação de risco do Pentágono para implementar o modelo Mythos da Anthropic a 29 de abril
De acordo com o Whale Factor, a Casa Branca está a contornar a avaliação de risco do Pentágono para implementar o modelo Mythos da Anthropic em agências federais a 29 de abril. A medida visa acelerar as capacidades de IA a nível federal e acompanhar o ritmo das redes de IA descentralizadas. Isto representa uma mudança significativa
GateNews1h atrás
Cognizant para adquirir a Astreya por $600M para expandir o negócio de infraestruturas de IA
De acordo com a Reuters, a 29 de abril, a Cognizant concordou em adquirir a Astreya por aproximadamente $600 milhões, à medida que expande o seu negócio de infraestruturas de IA. A Astreya é uma prestadora de serviços de TI especializada em infraestruturas de IA e serviços de centros de dados. Espera-se que o acordo seja concluído no segundo trimestre
GateNews1h atrás
30 Plugins Maliciosos no ClawHub Disfarçados de Ferramentas de IA, Descarregados Mais de 9.800 Vezes
De acordo com o investigador da Manifold, Ax Sharma, 30 plugins no ClawHub disfarçados de ferramentas de IA legítimas foram descarregados mais de 9.800 vezes, convertendo secretamente os assistentes de IA dos utilizadores em trabalhadores de criptomoeda. Os plugins, publicados sob a conta imaflytok, parecem ser escalonadores de tarefas e ferramentas de monitorização de rotina, mas contêm instruções ocultas que executam operações não autorizadas.
Uma vez instalados, os plugins registam automaticamente os assistentes de IA dos utilizadores em servidores de terceiros, geram carteiras de criptomoeda e extraem chaves privadas sem consentimento nem notificação do utilizador. Os assistentes, em seguida, fazem check-in de 4 em 4 horas à espera de atribuições de tarefas. Sharma salientou que os plugins não contêm código malicioso detetável por analisadores de segurança, recorrendo apenas a interfaces padrão e a ferramentas legítimas, o que os torna difíceis de identificar através de análises de segurança convencionais.
GateNews1h atrás