Karpathy unterstützt HTML-Ausgaben für große Sprachmodelle und sagt interaktives neuronales Video als ultimative Form voraus

Laut Andrej Karpathy, OpenAI-Gründungsmitglied und Schöpfer des Konzepts „vibe coding“, hat er heute den Ansatz des Claude Code-Teams unterstützt, für Ausgaben großer Sprachmodelle HTML statt Markdown zu verwenden. Karpathy skizzierte eine Roadmap zur Entwicklung von KI-Interaktionsschnittstellen: von Klartext zu Markdown zu HTML, gefolgt von mehreren Zwischenformen, bis hin zur finalen Stufe interaktiver neuronaler Videos, die direkt von Diffusionsmodellen erzeugt werden.

Karpathy führte diese Entwicklung auf die Bandbreite des menschlichen Gehirns zurück und merkte an, dass etwa ein Drittel des menschlichen Gehirns visuelle Signale parallel verarbeitet – eine „Zehn-Spur-Autobahn“ für die Eingabe von Informationen. Er argumentierte, dass die optimale Mensch-KI-Interaktion eine effiziente Spracheingabe für den Menschen und eine Ausgabe mit hoher Bandbreite (Bilder, Animationen oder Video) von der KI kombiniert. Er empfahl Nutzern, umgehend „strukturierte Antworten als HTML“ den Prompts hinzuzufügen, als kurzfristige Verbesserung.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.
Kommentieren
0/400
Keine Kommentare