Согласно Beating 动察, SubQ выпустила свою версию 1.1 Small с техническим отчётом, в котором заявлена точность извлечения 98% при экстремальной длине контекста 12 миллионов токенов, что было подтверждено сторонним оценщиком Appen. Модель показала производительность, сопоставимую с ведущими фронтир-моделями в практических тестах по программированию. Разработчик Subquadratic сообщил, что модель не обучали с нуля, а собрали, изменив механизм внимания у открытых фронтир-моделей, и провели инкрементальное обучение на 1 триллион токенов.
Несмотря на стороннюю валидацию, разработческое сообщество по-прежнему настроено скептически. Исследователи отметили, что заявленный прорыв не имеет фундаментальной технической новизны и по сути просто применяет уже существующие механизмы разреженного внимания. Некоторые указали на присутствие сгенерированного ИИ «наполнителя» в техническом отчёте, а другие предупредили, что механизм фильтрации может добавить накладные расходы планирования при параллельном использовании, потенциально вызывая сильные задержки для крайних случаев.