Le directeur de l’IA de Tencent, Yao Shunyu, défend le rythme de développement lors de la conférence du 5 juin

Le scientifique en chef IA de Tencent, Yao Shunyu, a fait sa première apparition publique le 5 juin lors de la Tencent Cloud AI Industry Application Conference, où il a discuté du grand modèle de langage Hunyuan 3 de la société et répondu aux critiques selon lesquelles Tencent aurait pris du retard dans le développement de l’IA. Yao, qui a rejoint Tencent depuis OpenAI et dirige l’équipe du modèle Hunyuan, a participé à un dialogue avec le vice-président exécutif senior de Tencent, Tang Daosheng, abordant la stratégie de modèles IA, le développement produit et l’avenir des agents intelligents. Le scientifique, âgé de 28 ans, a répondu au scepticisme extérieur en décrivant la compétition en IA comme une course d’endurance plutôt qu’un sprint, affirmant que le monde ne peut pas se reposer uniquement sur ChatGPT comme application dominante unique.

Yao Shunyu détaille l’approche de développement de Hunyuan 3

Yao a décrit trois améliorations clés de Hunyuan 3 pendant le dialogue de la conférence. « En fait, il n’y a rien de secret. Construire aujourd’hui des grands modèles est, dans une certaine mesure, une tâche assez fastidieuse. Il faut se concentrer sur le fait d’avoir la bonne infrastructure, d’avoir les bonnes données — la partie algorithmes est relativement simple », a déclaré Yao. Les améliorations comprenaient la refonte de toute l’infrastructure pour le pré-entraînement et l’apprentissage par renforcement, l’amélioration complète des systèmes de données et d’évaluation avec une plus grande importance accordée à la définition de problèmes réels et à l’amélioration de la qualité des données, et la prise de décisions guidées par le « goût » pour le recrutement, le rythme de développement des modèles et les compromis.

Yao, qui a proposé l’architecture ReAct durant ses recherches doctorales, a souligné que de nombreuses décisions dans le développement du modèle sont « guidées par le goût » plutôt que fondées sur des formules. « Beaucoup de décisions sont en réalité guidées par le goût », a-t-il répété à plusieurs reprises durant le dialogue. Sa thèse doctorale de 2019, intitulée « From Next Token Prediction to Digital Automation », a exploré les agents de langage à l’époque de GPT-2. « À ce moment-là, on était encore à l’ère de GPT-2, et ça ne pouvait même pas générer de paragraphes continus — il y avait beaucoup d’imperfections », a rappelé Yao. « Mais je sentais à l’époque que GPT était quelque chose de très élégant, et générer le token suivant est une tâche extrêmement simple tout en étant très générale. Je pensais que cela avait le potentiel un jour non seulement de produire le token suivant, mais d’automatiser tout dans ce monde. »

Yao a identifié les agents de codage comme la forme la plus essentielle d’agents intelligents parce qu’ils sont complets de Turing. Il a exposé la stratégie en trois volets de Tencent pour le développement des agents : mettre l’accent sur une conception système complète, exploiter pleinement les données qui reviennent des lignes produit, et conserver une imagination suffisante pour l’exploration. En matière de stratégie de développement de modèles, Yao a partagé trois orientations : maintenir des systèmes de données complets malgré le fait que le codage devienne la voie la plus importante, tirer parti des données de retour des lignes produit grâce à l’expérience de co-conception, et explorer les paradigmes suivants dans l’évolution technologique et produit.

Concernant les arbitrages coût-performance, Yao a déclaré que la performance est la condition préalable pour la rentabilité. « Beaucoup de gens constatent que l’utilisation d’un modèle puissant revient moins cher que d’utiliser un modèle médiocre, parce qu’il fait les choses correctement plus rapidement », a-t-il expliqué. Il a suggéré qu’obtenir une forte performance avec des modèles relativement plus petits et conserver une performance robuste sur la plupart des tâches « pourrait être plus précieux dans la Chine d’aujourd’hui ».

Tencent définit les exigences organisationnelles pour l’AGI

Yao a présenté l’idée de « la deuxième moitié de l’IA » dans un billet de blog l’année dernière, un terme désormais largement utilisé dans l’industrie. Il a expliqué que le cœur de ce concept réside dans un changement fondamental : alors que les décennies passées de développement de l’IA étaient centrées sur « trouver des méthodes », désormais que les méthodologies ont mûri, « trouver de bons problèmes » est devenu plus difficile. « Dans le passé, nous avons inventé des méthodes comme AlphaGo pour jouer au Go, mais il ne faisait que jouer aux échecs. Nous avons fait un modèle spécial pour la traduction, mais il ne savait faire que ça. Mais avec le pré-entraînement et le post-entraînement, nous avons maintenant un marteau universel capable de frapper n’importe quel clou », a expliqué Yao. « Le plus difficile, en fait, c’est de trouver les bons problèmes à résoudre. »

Yao a indiqué que l’immense portefeuille de produits de Tencent et ses scénarios fournissent des sources de problèmes authentiques pour la technologie IA, ce qui était sa deuxième raison de rejoindre l’entreprise. Il a identifié la culture comme sa motivation principale. « La première fois que j’ai discuté avec le président Tang et d’autres dirigeants, ma première impression a été que tout le monde était très honnête sur ce que nous faisons bien et sur ce que nous faisons moins bien — très direct, sans chercher à masquer les choses », a déclaré Yao. « Dans l’ensemble, Tencent fonctionne davantage sur la confiance que sur les indicateurs. Cette culture franche, peu centrée sur l’ego et pragmatique, associée à l’engagement envers le long-termisme, est cruciale pour construire une organisation IA durable. »

D’après Yao, la tâche la plus importante dans la deuxième moitié de l’IA est d’établir en Chine une organisation à long terme fondée sur l’AGI. Cette organisation exige de construire un « triangle équilibré » : une technologie fondation solide, des produits qui créent de la valeur, et un esprit d’exploration à la frontière.

Yao et Tang abordent les critiques sur le rythme au cours de la conférence

Yao a déclaré pendant le dialogue que l’IA est un jeu de long terme et que la deuxième moitié ne fait que commencer. « Je ne pense pas que ChatGPT et Claude Code seront les seuls super-applications — ce serait un monde très sombre. Aujourd’hui, c’est un peu comme dans les années 1970, quand les PC sont apparus pour la première fois : il reste encore énormément de choses à faire », a déclaré Yao. Il a prédit que l’avenir deviendra plus diversifié plutôt que plus singulier, notant que « les agents de codage ne font que commencer, et l’intelligence multimodale incarnée — beaucoup, beaucoup de nouveautés font juste leurs débuts ».

« Dans le passé, les modèles et les produits ont fait l’objet de nombreuses explorations et de nombreux détours. Je pense que c’est normal », a déclaré Yao. « Le plus important, c’est de savoir si nous pouvons nous affronter honnêtement, si nous pouvons être sincères, si nous pouvons voir les retours puis changer, et maintenir de la patience. C’est la chose la plus importante dans la deuxième moitié. »

Tang Daosheng a déclaré que Tencent accueille les critiques et les suggestions externes. « Nous sommes une entreprise avec des formats d’activité très divers. Parfois, nous pouvons être rapides, parfois lents, et nous échouerons dans certains domaines. Mais c’est une course d’endurance, et nous pensons que les modèles itéreront en continu, que les besoins des utilisateurs continueront d’évoluer, et que de nouveaux formats de produits émergeront », a déclaré Tang.

FAQ

Qu’a annoncé Yao Shunyu lors de la conférence Tencent du 5 juin ?

Yao Shunyu, le scientifique en chef IA de Tencent, a présenté l’approche de développement du grand modèle de langage Hunyuan 3 lors de la Tencent Cloud AI Industry Application Conference le 5 juin. Il a détaillé trois améliorations clés : reconstruire l’infrastructure pour le pré-entraînement et l’apprentissage par renforcement, mettre à niveau les systèmes de données et d’évaluation, et mettre en œuvre une prise de décision guidée par le « goût » à travers le recrutement et le développement des modèles. Yao a également répondu aux critiques concernant le rythme de développement de l’IA chez Tencent en qualifiant la compétition de course d’endurance plutôt que de sprint.

Pourquoi Yao Shunyu a-t-il rejoint Tencent depuis OpenAI ?

Yao a déclaré pendant le dialogue de la conférence que la culture était sa raison principale de rejoindre Tencent. Il a décrit sa première impression de la direction de Tencent comme « très honnête » et « directe, sans chercher à masquer les choses ». Yao a expliqué que Tencent fonctionne sur la base de la confiance plutôt que sur des indicateurs, avec une « culture franche, peu centrée sur l’ego et pragmatique », et un engagement envers le long-termisme qu’il juge crucial pour construire une organisation IA à long terme. Sa deuxième raison était le vaste portefeuille de produits de Tencent, qui fournit des sources de problèmes authentiques pour le développement de la technologie IA.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire