Согласно Beating 动察, SubQ выпустила свою версию 1.1 Small с техническим отчётом, в котором заявлена точность извлечения 98% при экстремальной длине контекста 12 миллионов токенов, что было подтверждено сторонним оценщиком Appen. Модель показала производительность, сопоставимую с ведущими фронтир-моделями в практических тестах по программированию. Разработчик Subquadratic сообщил, что модель не обучали с нуля, а собрали, изменив механизм внимания у открытых фронтир-моделей, и провели инкрементальное обучение на 1 триллион токенов.

Несмотря на стороннюю валидацию, разработческое сообщество по-прежнему настроено скептически. Исследователи отметили, что заявленный прорыв не имеет фундаментальной технической новизны и по сути просто применяет уже существующие механизмы разреженного внимания. Некоторые указали на присутствие сгенерированного ИИ «наполнителя» в техническом отчёте, а другие предупредили, что механизм фильтрации может добавить накладные расходы планирования при параллельном использовании, потенциально вызывая сильные задержки для крайних случаев.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

1ч назад

GLM-5.2 от Zhipu занял первое место среди моделей с открытым исходным кодом в бенчмарке AA, набрав 51 балл, и соответствует GPT-5.5 в тесте GDPval

8ч назад

Z.ai запускает open-source модель ИИ GLM-5.2 с контекстом на 1 млн токенов 17 июня

10ч назад

Zhipu выпустила модель GLM-5.2 с открытым исходным кодом; по производительности она находится в диапазоне 1%–4% от Claude Opus 4.8

06-16 11:01

Cartesia запускает модели Sonic-3,5 TTS и Ink-2 STT для голосового AI в реальном времени

06-15 11:57

Moonshot AI запускает Kimi K2.7 Code HighSpeed — в 6 раз быстрее с двойным тарифом API

Детальный анализ