Tencents KI-Chef Yao Shunyu verteidigt Entwicklungstempo auf der Konferenz am 5. Juni

Der Chief-AI-Wissenschaftler von Tencent, Yao Shunyu, trat am 5. Juni erstmals öffentlich auf der Tencent Cloud AI Industry Application Conference in Erscheinung. Dort sprach er über das Large-Language-Model Hunyuan 3 des Unternehmens und nahm Stellung zu der Kritik, Tencent habe beim KI-Entwicklungsstand den Anschluss verloren. Yao, der Tencent von OpenAI aus beigetreten ist und das Team für das Hunyuan-Model leitet, nahm an einem Dialog mit Tencent Senior Executive Vice President Tang Daosheng teil. Dabei ging es um die Strategie für KI-Modelle, die Produktentwicklung und die Zukunft intelligenter Agenten. Der 28-jährige Wissenschaftler ging auf skeptische Stimmen von außen ein, indem er den KI-Wettbewerb als Marathon statt als Sprint charakterisierte und sagte, die Welt könne sich nicht allein auf ChatGPT als eine dominierende Anwendung verlassen.

Yao Shunyu Details Hunyuan 3 Development Approach

Yao beschrieb im Dialog auf der Konferenz drei zentrale Verbesserungen in Hunyuan 3. „Es gibt eigentlich kein Geheimnis. Große Modelle zu bauen ist heute bis zu einem gewissen Grad eine eher mühselige Aufgabe. Wir sollten darauf fokussieren, dass die Infrastruktur stimmt, dass die Daten stimmen — der Algorithmus-Teil ist relativ einfach“, sagte Yao. Zu den Verbesserungen gehörten das komplette Neudurchdenken der Infrastruktur für Pre-Training und Reinforcement Learning, ein umfassendes Upgrade von Daten- und Evaluationssystemen mit stärkerem Fokus darauf, reale Probleme zu definieren und die Datenqualität zu verbessern, sowie geschmacksgetriebene Entscheidungen bei Einstellung, Entwicklungstakt des Modells und Kompromissen.

Yao, der während seiner Doktorarbeit die ReAct-Architektur vorgeschlagen hatte, betonte, dass viele Entscheidungen in der Modellentwicklung „geschmacksgetrieben“ und nicht formelbasiert seien. „Viele Entscheidungen sind tatsächlich sehr geschmacksgetrieben“, wiederholte er im Dialog mehrmals. Seine Doktorarbeit aus dem Jahr 2019 mit dem Titel „From Next Token Prediction to Digital Automation“ untersuchte Sprachagenten in der GPT-2-Ära. „Damals war es noch die GPT-2-Ära, und es konnte nicht einmal durchgehende Absätze generieren — es gab viele grobe Kanten“, erinnerte sich Yao. „Aber ich hatte damals das Gefühl, dass GPT eine sehr elegante Sache ist, und dass die Ausgabe des nächsten Tokens eine extrem einfache, aber sehr allgemeine Aufgabe ist. Ich glaubte, dass es eines Tages nicht nur den nächsten Token ausgeben könnte, sondern alles in dieser Welt automatisieren.“

Yao identifizierte Coding-Agenten als die grundlegendste Form intelligenter Agenten, weil sie Turing-vollständig sind. Er skizzierte die dreiteilige Strategie von Tencent für die Agentenentwicklung: den Schwerpunkt auf ein umfassendes Systemdesign zu legen, die Daten, die vollständig von den Produktlinien zurückfließen, optimal zu nutzen und genügend Vorstellungskraft für Erkundung zu bewahren. Zur Modellentwicklungsstrategie teilte Yao drei Richtungen: umfassende Datensysteme beizubehalten, obwohl das Programmieren zum wichtigsten Strang wird, Feedbackdaten aus den Produktlinien durch Co-Design-Erfahrung nutzbar zu machen und neue Paradigmen in Technologie und Produktentwicklung zu erforschen.

Was die Kosten-Nutzen-Abwägung betrifft, sagte Yao, dass Performance die Voraussetzung für Kosteneffizienz sei. „Viele finden, dass die Nutzung eines starken Modells günstiger ist als die Nutzung eines schlechten Modells, weil es Dinge schneller korrekt erledigt“, erklärte er. Er schlug vor, dass es „heute in China“ wertvoller sein könnte, starke Performance mit relativ kleineren Modellen zu erreichen und eine robuste Performance über die meisten Aufgaben hinweg aufrechtzuerhalten.

Tencent Defines AGI Organizational Requirements

Yao führte letztes Jahr in einem Blogbeitrag das Konzept von „AIs zweiter Halbzeit“ ein, einen Begriff, der inzwischen in der Branche weit verbreitet ist. Er erklärte, dass der Kern dieses Konzepts in einem grundlegenden Wandel liegt: Während sich die vergangenen Jahrzehnte der KI-Entwicklung darauf konzentrierten, „Methoden zu finden“, sei es nun, da sich die Methodiken ausgereift haben, „schwieriger geworden, gute Probleme zu finden“. „Früher haben wir Methoden wie AlphaGo erfunden, um Go zu spielen, aber es konnte nur Schach. Wir haben ein spezielles Modell für Übersetzungen gebaut, aber es konnte nur übersetzen. Aber mit Pre-Training und Post-Training haben wir jetzt einen universellen Hammer, der jedes einzelne Nagel treffen kann“, erklärte Yao. „Das Schwierige ist eigentlich, gute Probleme zu finden, die man lösen sollte.“

Yao sagte, dass das große Produktsortiment und die Einsatzszenarien von Tencent authentischen Problemlieferanten für KI-Technologie bieten — das war sein zweiter Grund, dem Unternehmen beizutreten. Er identifizierte die Kultur als seine wichtigste Motivation. „Als ich zum ersten Mal mit Präsident Tang und anderen Führungskräften gesprochen habe, war mein erster Eindruck, dass alle sehr ehrlich darüber waren, was wir gut machen und was wir nicht gut machen — sehr direkt, ohne Dinge zu überdecken“, sagte Yao. „Tencent arbeitet insgesamt eher auf Vertrauen als auf Kennzahlen hin. Diese offene, angstfreie und pragmatische Kultur — zusammen mit dem Commitment zum Langfristdenken — ist entscheidend, um eine langfristige KI-Organisation aufzubauen.“

Laut Yao ist die wichtigste Aufgabe in AIs zweiter Halbzeit der Aufbau einer langfristigen, auf AGI basierenden Organisation in China. Diese Organisation braucht den Aufbau eines „ausgewogenen Dreiecks“: solide Basistechnologie, Produkte, die Wert schaffen, und einen Geist für die Erkundung der Front.

Yao und Tang Address Pace Criticism at Conference

Yao sagte im Dialog, dass KI ein langfristiges Spiel sei und dass die zweite Halbzeit gerade erst begonnen habe. „Ich glaube nicht, dass ChatGPT und Claude Code die einzigen Super-Apps sein werden — das wäre eine sehr düstere Welt. Heute ist es ähnlich wie in den 1970er-Jahren, als PCs zum ersten Mal auftauchten — es gibt noch unglaublich viele Dinge, die erledigt werden müssen“, sagte Yao. Er prognostizierte, dass die Zukunft vielfältiger werden wird statt singularer. Er merkte an: „Coding-Agenten fangen gerade erst an, und multimodale, verkörperte Intelligenz — viele, viele neue Dinge fangen gerade erst an, zu passieren.“

„Früher haben Modelle und Produkte viel Erkundung betrieben und viele Umwege genommen. Ich denke, das ist normal“, sagte Yao. „Das Wichtigste ist, ob wir uns selbst ehrlich stellen können, ob wir real sein können, ob wir Feedback sehen und dann ändern können, und ob wir Geduld aufrechterhalten. Das ist das Wichtigste in der zweiten Halbzeit.“

Tang Daosheng sagte, Tencent begrüße externe Kritik und Vorschläge. „Wir sind ein Unternehmen mit sehr unterschiedlichen Geschäftsformaten. Manchmal könnten wir schnell sein, manchmal langsam, und wir werden in einigen Bereichen scheitern. Aber das ist ein Marathon, und wir glauben, dass sich Modelle kontinuierlich iterieren, Nutzerbedürfnisse sich weiter verändern und neue Produktformate entstehen werden“, sagte Tang.

FAQ

Was hat Yao Shunyu auf der Tencent-Konferenz am 5. Juni angekündigt?

Yao Shunyu, Tencents Chief AI Scientist, stellte am 5. Juni auf der Tencent Cloud AI Industry Application Conference den Entwicklungsansatz für das Large-Language-Model Hunyuan 3 vor. Er ging auf drei zentrale Verbesserungen ein: das Neubereitstellen der Infrastruktur für Pre-Training und Reinforcement Learning, das Upgrade von Daten- und Evaluationssystemen sowie die Implementierung geschmacksgetriebener Entscheidungsfindung über Einstellung und Modellentwicklung hinweg. Yao reagierte außerdem auf Kritik an der Entwicklungsgeschwindigkeit von Tencent, indem er den Wettbewerb als Marathon statt als Sprint charakterisierte.

Warum ist Yao Shunyu von OpenAI zu Tencent gewechselt?

Yao sagte im Dialog auf der Konferenz, dass die Kultur sein wichtigster Grund für den Wechsel zu Tencent sei. Er beschrieb seinen ersten Eindruck von der Führung in Tencent als „sehr ehrlich“ und „geradlinig, ohne Dinge zu überdecken“. Yao erklärte, dass Tencent auf Vertrauen statt auf Kennzahlen setzt, mit einer „offenen, wenig egogetriebenen und pragmatischen Kultur“ sowie einem Commitment zum Langfristdenken, das er als entscheidend für den Aufbau einer langfristigen KI-Organisation ansieht. Sein zweiter Grund war das umfangreiche Produktsortiment von Tencent, das authentische Problemlieferanten für die Weiterentwicklung von KI-Technologie bereitstellt.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare