Lors du sommet de la conférence Beijing Zhiyuan du 12 juin, le directeur de l’Institut de recherche en IA de Beijing Zhiyuan Wang Zhongyuan, le responsable du modèle grand format MiMo de Xiaomi Luo Fuli, le professeur de l’informatique de l’université Tsinghua et cofondateur de MianBi Intelligence Liu Zhiyuan, le directeur adjoint de l’Institut de recherche en IA de l’université Tsinghua et fondateur de ShengShu Technology Zhu Jun, ainsi que le président de l’université Technologique de Nanyang An Bo se sont réunis pour un dialogue de sommet sur l’industrie des grands modèles en Chine. La discussion a porté sur la manière dont les jeunes peuvent gérer l’anxiété face à l’itération rapide des technologies d’IA. Dans un contexte d’accélération du développement de l’IA — du dernier grand modèle Claude Fable 5 d’Anthropic à l’explosion de la croissance des agents intelligents — les intervenants ont exploré les possibilités d’auto-évolution de l’IA, des scénarios d’avenir pour les world models et des stratégies pour s’adapter à une époque où la vitesse d’itération technologique redéfinit les limites cognitives humaines de l’intelligence.

L’IA qui crée l’IA devient une tendance

À une époque où les grands modèles commençaient encore à renouveler la cognition humaine, une tendance plus perturbatrice est apparue : l’IA a commencé à créer l’IA.

« L’an dernier, les meilleurs grands modèles ne faisaient que réaliser une exécution à haute précision dans des scénarios avec des instructions claires, mais désormais, les capacités des meilleurs modèles se sont étendues à des niveaux de résolution de problèmes abstraits », a observé Luo Fuli. Les grands modèles actuels peuvent accomplir des processus fondamentaux de recherche scientifique, notamment la planification des procédures expérimentales et la vérification des résultats d’exécution, et l’écart essentiel avec les meilleurs chercheurs scientifiques se réduit.

Liu Zhiyuan a déclaré que le cœur de la révolution industrielle était les machines remplaçant le travail physique humain, avec pour forme ultime des machines fabriquant des machines ; le cœur de la révolution intelligente est l’IA remplaçant la répétition du travail mental humain, et « l’IA créant l’IA » est le marqueur central de l’entrée de la révolution intelligente dans une phase avancée.

D’après Liu Zhiyuan, la révolution industrielle a pris des centaines d’années pour atteindre la fabrication autonome de machines, tandis que les grands modèles ne sont entrés dans la phase d’itération autonome de l’IA que six à sept ans après leur apparition, avec une vitesse d’itération technologique bien supérieure à celle des révolutions industrielles traditionnelles.

« À l’étape actuelle, le moteur central de la récursive self-evolution de l’IA est encore l’humanité », a déclaré Liu Zhiyuan. Le modèle technique actuel est mené par l’humain : l’IA aide à mener la recherche et l’itération des modèles. Même si, à l’avenir, une auto-iteration autonome de haut niveau de l’IA est atteinte, la subjectivité et l’initiative humaines restent irremplaçables — au final, la direction de recherche de l’IA et ses objectifs fondamentaux au service de la société doivent toujours être définis par l’humain, c’est la relation centrale entre les humains et l’IA.

Deux jours plus tôt, Anthropic a officiellement publié Claude Fable 5, réalisant des bonds significatifs en capacité de codage et en capacité d’agents intelligents — une migration complète de dépôt d’une base de code de 50 millions de lignes que l’on met un mois à faire pour une équipe humaine ne prend à Fable 5 qu’un jour. Cette avancée marquante est devenue le premier point focal de la discussion.

« Fable 5 est encore un produit intermédiaire », a déclaré Luo Fuli. À ses yeux, la trajectoire de la mise à l’échelle continue des grands modèles n’est pas loin de s’arrêter. « Fable 5 représente une expansion naturelle des grands modèles dans trois dimensions : premièrement, l’ampleur des paramètres de pré-entraînement atteint des paliers de multiplication ; deuxièmement, l’échelle au moment de l’inférence et l’investissement de puissance de calcul pour l’apprentissage par renforcement augmentent substantiellement ; troisièmement, les données d’entraînement passent du texte naturel d’internet à une nouvelle étape de données synthétiques produites conjointement par les humains et des agents intelligents. »

De l’avis du professeur de l’université Tsinghua et fondateur de ShengShu Technology Zhu Jun, les exigences de déploiement diffèrent selon les scénarios, et tous les scénarios ne nécessitent pas des capacités de modèle extrêmement précises — dans la plupart des scénarios conventionnels, on peut déployer en s’appuyant sur la compréhension intuitive des modèles, ce qui constitue aussi la valeur centrale apportée par les grands modèles.

Zhu Jun a déclaré que, concernant les discussions animées de l’industrie sur l’Agent (agents intelligents) et la résolution de problèmes de code qui consomment de grandes quantités de Tokens (éléments de mots), les nouveaux modèles réduisent substantiellement la consommation de Tokens pour des tâches équivalentes, ce qui est la direction correcte pour le développement de l’industrie.

Selon lui, le potentiel de mise à l’échelle des modèles vidéo et des world models reste énorme. « L’accumulation actuelle de données physiques, la technologie d’utilisation efficace des données, l’optimisation d’architecture des modèles et d’autres directions ne font que commencer ; il reste, à l’avenir, un espace d’exploration et d’amélioration extrêmement vaste. »

L’innovation va souvent à contre-courant du consensus

À mesure que la technologie de l’IA itère rapidement, de nombreux jeunes tombent dans l’anxiété — les mises à jour technologiques sont trop rapides, l’itération des connaissances est fréquente, et les compétences et professions traditionnelles se transforment continuellement. Comment réagir ?

Pour Luo Fuli, la vitesse d’itération des grands modèles et des agents intelligents dépasse de loin les attentes de chacun, et les limites des capacités ainsi que le partage du travail entre humains et IA changent continuellement.

« Mon conseil central aux jeunes tient en un seul point : conserver toujours le désir d’explorer et la curiosité. Utilisez extrêmement les outils d’IA les plus avancés, et dans le processus d’essais et d’erreurs continus, cultivez un jugement et une esthétique de recherche scientifique qui vous sont propres. À une époque de transformation technologique rapide, la cognition, le jugement et l’esthétique uniques sont la compétitivité la plus centrale et la plus irremplaçable des jeunes », a déclaré Luo Fuli.

Zhu Jun estime que la technologie de l’IA change chaque jour, que tous les praticiens apprennent en continu et itèrent en continu, et que personne ne peut rester inchangé. Plus on se trouve dans le flux de la transformation technologique, plus il faut consolider sa propre base ; c’est là la compétitivité centrale pour répondre aux changements de l’industrie. « Nous nous engageons à créer un environnement de croissance natif à l’IA, permettant aux étudiants d’accueillir l’IA et de l’utiliser correctement dès le début de leur apprentissage. Chacun n’a donc pas besoin d’être excessivement anxieux — tout le monde se trouve sur la même ligne de départ ; les prédécesseurs de l’industrie, les praticiens et les étudiants apprennent tous synchroniquement et mettent tous à jour leurs connaissances synchroniquement. Accueillir activement le changement et cultiver en profondeur en continu est la meilleure méthode de croissance. »

Liu Zhiyuan a conseillé : d’abord, oser être le premier et oser innover. L’AGI et la révolution intelligente sont des territoires entièrement nouveaux et inconnus, et la véritable innovation « va souvent à contre-courant du consensus », en faisant des choses hors consensus. Oser tenter dans des territoires non explorés et faire des choix différenciés permet de saisir les opportunités futures.

Ensuite, s’en tenir à ses intentions initiales et persévérer. Les choix innovants différenciés seront inévitablement accompagnés de doute et de négation. Pouvez-vous résister à la pression et persister dans une culture approfondie : c’est la clé pour dépasser les goulots d’étranglement et produire des résultats.

Troisièmement, dépasser la cognition inhérente et s’auto-innover en continu. Après avoir obtenu des résultats par étapes, ne vous attachez pas rigidement aux chemins qui ont déjà réussi. Percevez proactivement les tendances de l’industrie, niez l’expérience inhérente et explorez entièrement de nouvelles directions afin de rester continuellement au rythme de l’itération technologique.

« L’anxiété actuelle des jeunes est essentiellement causée par un état d’esprit trop utilitariste. Si les objectifs d’apprentissage et de travail se résument à des salaires élevés et à la poursuite des tendances, on tombera dans une anxiété passive », a déclaré An Bo.

De l’avis d’An Bo, premièrement, les jeunes devraient choisir la bonne voie et approfondir profondément les problèmes centraux, en se concentrant sur des directions de recherche précieuses et significatives, en évitant la concurrence interne inefficace. Deuxièmement, la valeur des diplômes académiques s’affaiblit. La compétitivité vraiment centrale aujourd’hui, c’est la capacité pratique et la cognition à la pointe — même sans hauts diplômes académiques, cultiver profondément la recherche de pointe de première ligne et accumuler une expérience pratique peut permettre une croissance rapide. Enfin, partir en solo ne suffit plus à suivre la vitesse de l’industrie. Cherchez proactivement des partenaires partageant les mêmes idées, formez des communautés de communication, et lorsque vous rencontrez des problèmes, communiquez et discutez rapidement afin d’éviter l’autoconsommation interne.

FAQ

Que a conseillé Luo Fuli aux jeunes lors de la conférence Beijing Zhiyuan du 12 juin ?

Luo Fuli a conseillé aux jeunes de conserver toujours le désir d’explorer et la curiosité, d’utiliser au maximum des outils d’IA à la pointe, et, dans le processus d’essais et d’erreurs continus, de cultiver un jugement et une esthétique de recherche scientifique qui leur sont propres. Elle a indiqué qu’à une époque de transformation technologique rapide, la cognition, le jugement et l’esthétique uniques sont la compétitivité la plus centrale et la plus irremplaçable des jeunes.

Quelles capacités techniques Claude Fable 5 démontre-t-il selon les intervenants de la table ronde ?

D’après la discussion, Claude Fable 5 a réalisé des bonds significatifs en capacité de codage et en capacité d’agents intelligents. Une migration complète de dépôt d’une base de code de 50 millions de lignes que l’on met un mois à réaliser pour une équipe humaine ne prend à Fable 5 qu’un jour. Luo Fuli a décrit Fable 5 comme représentant une expansion naturelle des grands modèles dans trois dimensions : l’ampleur des paramètres de pré-entraînement atteignant un facteur d’échelle multiple, l’échelle au moment de l’inférence et l’investissement en puissance de calcul pour l’apprentissage par renforcement augmentant substantiellement, et les données d’entraînement passant du texte naturel d’internet à des données synthétiques produites conjointement par des humains et des agents intelligents.

Comment Liu Zhiyuan a-t-il décrit la relation entre les humains et l’IA dans le processus d’auto-évolution ?

Liu Zhiyuan a déclaré qu’à l’étape actuelle, le moteur central de la récursive self-evolution de l’IA reste l’humanité, le modèle technique actuel étant mené par l’humain et l’IA aidant à accomplir la recherche et l’itération des modèles. Il a souligné que, même si, à l’avenir, une auto-iteration autonome de haut niveau de l’IA est obtenue, la subjectivité et l’initiative humaines restent irremplaçables — au final, la direction de recherche de l’IA et ses objectifs fondamentaux pour servir la société doivent toujours être définis par l’humain, ce qui constitue la relation centrale entre les humains et l’IA.

Afficher la source

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.

Actualités associées

Il y a 4h

L’Institut de recherche Zhiyuan publie le premier modèle universel de fondation du monde, Physis-v0.1, à l’échelle mondiale

Il y a 4h

Douyin lance un agent d’IA anti-harcèlement en ligne et étend la détection des utilisateurs à risque de 91,5 %

Il y a 7h

iFlytek crée une filiale Ciyuan Xinghuo Technology avec un capital de 1 milliard de RMB le 12 juin