Chercheurs d’OpenAI : les systèmes d’IA pourraient gérer la plupart des travaux de recherche dans deux ans

Message de Gate News, 29 avril — Les chercheurs d’OpenAI Sébastien Bubeck et Ernest Ryu affirment que les systèmes d’IA pourraient accomplir la plupart des travaux de recherche réalisés par des humains dans les deux prochaines années, en présentant les mathématiques comme une mesure claire des progrès de l’IA. Contrairement aux tests de performance vagues, les problèmes mathématiques offrent une vérification précise : les réponses sont soit correctes, soit incorrectes, sans place pour l’ambiguïté.

Bubeck a noté que la vraie « pensée » de l’IA exige de survivre à de longues chaînes de raisonnement. Une seule erreur dans un argument en plusieurs étapes fait s’effondrer toute la démonstration, ce qui rend la détection et la correction des erreurs au cours du processus l’objectif ultime pour les modèles avancés. Les laboratoires internes d’OpenAI ont déjà généré plus de dix tout nouveaux théorèmes, publiables dans des revues de pointe de combinatoire, démontrant que l’IA produit désormais un travail réellement original et novateur, au-delà du simple fait de recombiner des articles existants.

Cependant, des percées scientifiques durables exigent une attention constante sur des semaines de tests. Les systèmes actuels nécessitent encore une supervision humaine stricte pour guider et vérifier chaque changement de direction. Bubeck utilise le « temps d’AGI » pour mesurer la durée pendant laquelle un modèle peut imiter de manière autonome la pensée humaine ; les systèmes actuels fonctionnent à peu près de quelques jours à une semaine, l’objectif de l’industrie étant des semaines ou des mois pour permettre un travail autonome dans des domaines comme la biologie.

La mémoire à long terme est essentielle pour ce futur. Les fenêtres de discussion standard limitent la profondeur — des preuves mathématiques complexes dépassent souvent 50 pages — tandis que les dépôts de code montrent comment des sessions de travail prolongées permettent un traitement de problèmes plus approfondi. À mesure que l’IA gagne en indépendance et en mémoire, l’expertise humaine devient plus précieuse, pas moins. Les travailleurs doivent conserver les connaissances fondamentales approfondies pour contester et vérifier les réponses de la machine, et les organisations devront mettre en place de nouveaux filtres automatisés et systèmes de réputation pour maintenir la confiance face à un flot de recherches assistées par l’IA.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

La plateforme d’IA Certifyde lève $2M en financement de démarrage avec le PDG de Ripple Brad Garlinghouse

Selon ChainCatcher, la plateforme d’application IA Certifyde a annoncé la clôture d’un tour de table de $2 million. Les investisseurs incluent K5 Global, Flamingo Capital, ainsi que des investisseurs providentiels comme le PDG de Ripple Brad Garlinghouse, le cofondateur de Honey George Ruan et le cofondateur de Nutra Roland

GateNewsIl y a 27m

DeepSeek lance une fonctionnalité de reconnaissance d’images en tests bêta

Selon PANews, DeepSeek a lancé aujourd’hui sa fonction de reconnaissance d’images (29 avril), actuellement en phase de tests bêta. Les utilisateurs de la version web et de l’application mobile peuvent tous deux être sélectionnés pour le déploiement bêta.

GateNewsIl y a 1h

Anthropic lance 8 connecteurs d’outils créatifs pour Claude, dont Blender, Adobe, Autodesk

Anthropic a annoncé une suite de connecteurs d’outils créatifs qui permettent à Claude de contrôler directement des logiciels professionnels utilisés par les designers et les musiciens. Les huit connecteurs initiaux couvrent la modélisation 3D, le design visuel, la production musicale et la performance en direct, avec des partenaires incluant Blender, Adobe,

GateNewsIl y a 1h

La Maison-Blanche contourne l’évaluation des risques du Pentagone pour déployer le modèle Mythos d’Anthropic le 29 avril

Selon Whale Factor, la Maison-Blanche contourne l’évaluation des risques du Pentagone pour déployer le modèle Mythos d’Anthropic auprès de l’ensemble des agences fédérales le 29 avril. Cette démarche vise à accélérer les capacités d’IA du gouvernement fédéral et à se synchroniser avec la cadence des réseaux d’IA décentralisés. Cela représente un changement important

GateNewsIl y a 1h

Cognizant pour acquérir Astreya pour $600M afin d’étendre son activité d’infrastructure IA

Selon Reuters, le 29 avril, Cognizant a accepté d’acquérir Astreya pour environ $600 million, alors qu’elle étend son activité d’infrastructure IA. Astreya est un fournisseur de services informatiques spécialisé dans l’infrastructure d’IA et les services de centres de données. La transaction devrait être conclue au deuxième trimestre

GateNewsIl y a 1h

30 plugins malveillants sur ClawHub déguisés en outils d’IA, téléchargés plus de 9 800 fois

D’après le chercheur de Manifold, Ax Sharma, 30 plugins sur ClawHub déguisés en outils d’IA légitimes ont été téléchargés plus de 9 800 fois, tout en convertissant secrètement les assistants IA des utilisateurs en travailleurs de cryptomonnaie. Les plugins, publiés sous le compte imaflytok, semblent être des planificateurs de tâches de routine a

GateNewsIl y a 1h
Commentaire
0/400
Aucun commentaire