Según Beating intelligence, el equipo de Sina Weibo recientemente publicó de forma open-source VibeThinker-3B, un modelo de razonamiento de 3 mil millones de parámetros que logra un rendimiento de nivel pionero en tareas de matemáticas y codificación, con algunas métricas acercándose o superando a DeepSeek V3.2, GLM-5 y Gemini 3 Pro.
Construido sobre Qwen2.5-Coder-3B, el modelo utiliza un pipeline de entrenamiento de Spectrum-to-Signal con un espacio de razonamiento de 64K. Mediante auto-destilación y verificación a nivel de pasos durante la inferencia, VibeThinker-3B mejoró las puntuaciones de las pruebas de matemáticas AIME26 de 94,3 a 97,1.