Según Beating 动察, SubQ lanzó su versión Small de 1,1 con un informe técnico que afirma una precisión de recuperación del 98% con una longitud de contexto extrema de 12 millones de tokens, validada por el evaluador externo Appen. El modelo logró un rendimiento comparable al de los principales modelos frontier en pruebas prácticas de programación. La empresa de desarrollo Subquadratic reveló que el modelo no se entrenó desde cero, sino que se construyó modificando el mecanismo de atención de modelos frontier de código abierto y realizando un entrenamiento incremental con 1 billón de tokens.
A pesar de la validación de terceros, la comunidad de desarrolladores sigue siendo escéptica. Los investigadores señalaron que el supuesto avance carece de novedad técnica fundamental y simplemente aplica mecanismos de atención dispersa existentes. Algunos señalaron texto de relleno generado por IA en el informe técnico, mientras que otros advirtieron que el mecanismo de filtrado podría introducir una sobrecarga de planificación durante el uso concurrente, lo que potencialmente causaría una latencia severa en casos límite.