Mensaje de Gate News, 29 de abril — Los investigadores de OpenAI Sébastien Bubeck y Ernest Ryu afirman que los sistemas de IA podrían realizar la mayor parte del trabajo de investigación humano en dos años, presentando las matemáticas como una medida clara del progreso de la IA. A diferencia de las pruebas de rendimiento vagas, los problemas matemáticos ofrecen una verificación precisa: las respuestas son correctas o incorrectas, sin dejar margen para la ambigüedad.

Bubeck señaló que el verdadero pensamiento de la IA requiere sobrevivir a largas cadenas de razonamiento. Un solo error en un argumento de varios pasos derrumba toda la demostración, por lo que la detección y corrección de errores a mitad del proceso es el objetivo definitivo para los modelos avanzados. Los laboratorios internos de OpenAI ya han generado más de diez teoremas completamente nuevos publicables en revistas de combinatoria de primer nivel, demostrando que la IA ahora produce trabajo genuinamente original y rompedor, más allá de simplemente recombinar artículos existentes.

Sin embargo, los avances científicos sostenidos exigen un enfoque constante durante semanas de pruebas. Los sistemas actuales todavía requieren una supervisión humana estricta para guiar y verificar cada cambio de dirección. Bubeck usa "tiempo de AGI" para medir cuánto tiempo un modelo puede imitar de forma independiente el pensamiento humano; los sistemas actuales operan aproximadamente de días a una semana, y el objetivo de la industria es lograr semanas o meses para permitir trabajo autónomo en campos como la biología.

La memoria a largo plazo es fundamental para este futuro. Las ventanas de chat estándar limitan la profundidad: las demostraciones matemáticas complejas a menudo superan 50 páginas, mientras que los repositorios de código muestran cómo las sesiones de trabajo prolongadas permiten una resolución de problemas más profunda. A medida que la IA gane independencia y memoria, la experiencia humana se vuelve más valiosa, no menos. Los trabajadores deben conservar el conocimiento profundo y básico para desafiar y verificar las respuestas de las máquinas, y las organizaciones necesitarán nuevos filtros automatizados y sistemas de reputación para mantener la confianza ante una avalancha de investigación asistida por IA.

Ver fuente

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.

Noticias relacionadas

04-29 03:35

Informe de a16z Crypto: Los agentes de IA logran una tasa de éxito de hasta 70% al explotar vulnerabilidades de manipulación de precios DeFi con conocimiento estructurado

04-28 18:52

安思维（Anthropic）估值触及 $1 万亿美元，在二级市场超越OpenAI

04-28 08:31

Adobe Launches Firefly AI Assistant with Multi-App Workflows, Integrates Claude

04-27 09:11

Greg Brockman de OpenAI: la IA cambia del chat a la ejecución autónoma de tareas

04-27 05:17

GPT-5.5 重回编码前沿，但 OpenAI 在输给 Opus 4.7 后更换了基准

Análisis en profundidad