Veo una nueva clasificación de modelos de IA liderada por Gemini 3 Flash.


Según el benchmark PinchBench, en las tareas de OpenClaw, Gemini 3 Flash ha alcanzado un 95.1% de tasa de éxito y se ha posicionado en la cima.

En segundo y tercer lugar están minimax-m2.1 (93.6%) y kimi-k2.5 (93.4%).
Claude Sonnet 4.5 tiene un 92.7% mientras que GPT-4o un 85.2%.
Se puede notar la diferencia entre estos modelos.

El CISO de Magma, 23pads, compartió estos datos.
El rendimiento de estos modelos de IA varía bastante en las tareas de los agentes.
El liderazgo de Gemini todavía es claro por ahora.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado