Investigadores de OpenAI: los sistemas de IA podrían manejar la mayor parte del trabajo de investigación en dos años

Mensaje de Gate News, 29 de abril — Los investigadores de OpenAI Sébastien Bubeck y Ernest Ryu afirman que los sistemas de IA podrían realizar la mayor parte del trabajo de investigación humano en dos años, presentando las matemáticas como una medida clara del progreso de la IA. A diferencia de las pruebas de rendimiento vagas, los problemas matemáticos ofrecen una verificación precisa: las respuestas son correctas o incorrectas, sin dejar margen para la ambigüedad.

Bubeck señaló que el verdadero pensamiento de la IA requiere sobrevivir a largas cadenas de razonamiento. Un solo error en un argumento de varios pasos derrumba toda la demostración, por lo que la detección y corrección de errores a mitad del proceso es el objetivo definitivo para los modelos avanzados. Los laboratorios internos de OpenAI ya han generado más de diez teoremas completamente nuevos publicables en revistas de combinatoria de primer nivel, demostrando que la IA ahora produce trabajo genuinamente original y rompedor, más allá de simplemente recombinar artículos existentes.

Sin embargo, los avances científicos sostenidos exigen un enfoque constante durante semanas de pruebas. Los sistemas actuales todavía requieren una supervisión humana estricta para guiar y verificar cada cambio de dirección. Bubeck usa “tiempo de AGI” para medir cuánto tiempo un modelo puede imitar de forma independiente el pensamiento humano; los sistemas actuales operan aproximadamente de días a una semana, y el objetivo de la industria es lograr semanas o meses para permitir trabajo autónomo en campos como la biología.

La memoria a largo plazo es fundamental para este futuro. Las ventanas de chat estándar limitan la profundidad: las demostraciones matemáticas complejas a menudo superan 50 páginas, mientras que los repositorios de código muestran cómo las sesiones de trabajo prolongadas permiten una resolución de problemas más profunda. A medida que la IA gane independencia y memoria, la experiencia humana se vuelve más valiosa, no menos. Los trabajadores deben conservar el conocimiento profundo y básico para desafiar y verificar las respuestas de las máquinas, y las organizaciones necesitarán nuevos filtros automatizados y sistemas de reputación para mantener la confianza ante una avalancha de investigación asistida por IA.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

La plataforma de IA Certifyde recauda $2M en financiación semilla con el CEO de Ripple, Brad Garlinghouse

Según ChainCatcher, la plataforma de aplicaciones de IA Certifyde anunció la finalización de una ronda de financiación semilla de $2 millones. Los inversores incluyen K5 Global, Flamingo Capital y ángeles inversores como el CEO de Ripple, Brad Garlinghouse, el cofundador de Honey, George Ruan, y el cofundador de Nutra, Roland

GateNewshace1h

DeepSeek Lanza Función de Reconocimiento de Imágenes en Pruebas Beta

Según PANews, DeepSeek lanzó hoy su función de reconocimiento de imágenes (April 29), actualmente en pruebas beta. Se puede seleccionar tanto a los usuarios de la versión web como de la aplicación móvil para el despliegue en fase beta.

GateNewshace2h

Anthropic Lanza 8 Conectores de Herramientas Creativas para Claude, Incluyendo Blender, Adobe, Autodesk

Anthropic ha anunciado una serie de conectores de herramientas creativas que permiten que Claude controle directamente software profesional utilizado por diseñadores y músicos. Los ocho conectores iniciales abarcan modelado 3D, diseño visual, producción musical y presentaciones en vivo, con socios que incluyen Blender, Adobe,

GateNewshace2h

La Casa Blanca elude la evaluación de riesgos del Pentágono para implementar el modelo Mythos de Anthropic el 29 de abril

Según Whale Factor, la Casa Blanca está eludiendo la evaluación de riesgos del Pentágono para implementar el modelo Mythos de Anthropic en agencias federales el 29 de abril. La medida busca acelerar las capacidades de IA a nivel federal y emparejar el ritmo de las redes de IA descentralizadas. Esto representa un cambio significativo

GateNewshace2h

Cognizant para adquirir Astreya por $600M para ampliar el negocio de infraestructura de IA

Según Reuters, el 29 de abril, Cognizant acordó adquirir Astreya por aproximadamente $600 millones, ya que amplía su negocio de infraestructura de IA. Astreya es un proveedor de servicios de TI especializado en infraestructura de IA y servicios de centros de datos. Se espera que el acuerdo se cierre en el segundo trimestre

GateNewshace3h

30 plugins maliciosos en ClawHub disfrazados de herramientas de IA, descargados más de 9.800 veces

Según el investigador de Manifold, Ax Sharma, 30 plugins en ClawHub disfrazados como herramientas de IA legítimas se han descargado más de 9.800 veces mientras, en secreto, convertían los asistentes de IA de los usuarios en trabajadores de criptomonedas. Los plugins, publicados bajo la cuenta imaflytok, aparecen como planificadores de tareas y herramientas de supervisión habituales, pero contienen instrucciones ocultas que ejecutan operaciones no autorizadas a

GateNewshace3h
Comentar
0/400
Sin comentarios