
En una charla de GTC Taipei 2026, el CEO de NVIDIA, Jensen Huang, explicó de forma sistemática la definición de la arquitectura de los AI Agent: los modelos de lenguaje grandes (LLM) se encargan de pensar, razonar y planificar; mientras que el motor de orquestación externo (harness), actúa como un sistema operativo, conectando el modelo con herramientas como hojas de cálculo, navegadores y bases de datos, y administrando la memoria de trabajo y la memoria a largo plazo.
Definición de la arquitectura de los AI Agent: grandes modelos más motor de orquestación
En su discurso, Huang dividió la estructura central de los AI Agent en dos partes: el gran modelo como “centro de pensamiento”, responsable del razonamiento y la planificación; y el motor de orquestación externo que cumple el rol de sistema operativo, conectando el modelo con diversos tipos de herramientas, al tiempo que gestiona la memoria de trabajo a corto plazo y la memoria a largo plazo.
Señaló que esta arquitectura representa un cambio fundamental en el modo de cómputo, no una simple mejora de eficiencia. Durante la demostración en el lugar, mencionó: “Aquí usamos Claude Code, pero Codex también se desempeña muy bien”.
Tres casos de demostración confirmados en GTC Taipei
En la charla, Huang demostró tres casos de AI Agent. Primero, generar directamente el código completo de una aplicación a partir de indicaciones en lenguaje natural; segundo, tras introducir una descripción en texto, el Agent generó en tiempo real una animación dinámica de partículas con el tema “Taipei 101 → GTC Taipei 2026 → NVIDIA logo”; tercero, tomó en el lugar una foto donde faltaba la pinza para la batería de un control remoto, y el Agent llamó automáticamente a una herramienta CAD para generar un archivo de pieza de reemplazo listo para imprimir en 3D.
Refutando el argumento del cierre de software: “Ahora es la mejor época para hacer empresas de software”
Sobre la afirmación circulante de que “los AI Agent harán cerrar a las empresas de software”, Huang la refutó con claridad: “Todo lo contrario”. Dijo que, cuando ya no se limita por la cantidad de humanos, los enormes Agent usarán más herramientas de software que las personas. “Ahora es la mejor época para hacer empresas de software” —pero con la condición de que el software se diseñe y presente de una forma que los Agent puedan invocar directamente. La biblioteca CUDA X de NVIDIA se abre por completo para que los Agent la usen, y la eficiencia con la que los Agent la utilizan incluso supera la de los desarrolladores humanos.
Preguntas frecuentes
¿En qué difiere fundamentalmente el AI Agent definido por Jensen Huang de las aplicaciones de software tradicionales?
El AI Agent definido por Huang en GTC Taipei 2026 está compuesto por LLM (razonamiento y planificación) y un motor de orquestación (conexión de herramientas + gestión de memoria). El software tradicional se basa en “iniciar-hacer clic-escribir” por parte del usuario; el modo Agent es “describir a la IA la intención, y la IA genera automáticamente el código, llama herramientas y entrega resultados”, por lo que el sujeto operativo pasa de las personas a la propia IA.
¿Qué revela el caso de la pinza de batería del control remoto para impresión en 3D?
Esta demostración en el lugar mostró la capacidad del Agent para llamar múltiples herramientas: el Agent identifica el problema en la foto (falta la pinza para la batería), entiende la necesidad (se requiere reemplazar la pieza), llama a una herramienta CAD para modelar y genera directamente un archivo listo para imprimir en 3D; completó un flujo de trabajo completo desde el reconocimiento del problema hasta la solución, sin necesidad de intervención humana paso a paso.
¿Qué significa que CUDA X se abra completamente a los Agent?
Jensen Huang anunció que la biblioteca CUDA X de NVIDIA ya está abierta por completo para que los AI Agent la usen, y que la eficiencia de uso de los Agent supera a la de los desarrolladores humanos. Esto significa que la infraestructura central de aceleración de IA de NVIDIA se amplía oficialmente al ecosistema de desarrollo de Agent, proporcionando a los desarrolladores una base de invocación de herramientas más eficiente.