Gate News сообщает, 25 марта Cursor опубликовала технический отчет Composer 2, впервые раскрывая полный план обучения. Базовая модель Kimi K2.5 использует архитектуру MoE, общий объем параметров составляет 1,04 триллиона, активных параметров — 32 миллиарда. Обучение делится на два этапа: сначала проводится продолжительное предварительное обучение на кодовых данных для усиления знаний о кодировании, затем с помощью масштабного усиленного обучения повышается способность к энд-енд кодированию. Среда RL полностью моделирует реальные сценарии использования Cursor, включая редактирование файлов, работу в терминале, вызовы инструментов для поиска кода и другие, позволяя модели обучаться в условиях, приближенных к производственной среде. В отчете также опубликован методика создания собственной базы тестов CursorBench: задачи собираются из реальных кодовых сессий инженерных команд, а не создаются вручную. Базовая модель Kimi K2.5 набрала 36,0 баллов по этой базе, после двух этапов обучения Composer 2 достиг 61,3 баллов, что составляет рост на 70%. Cursor заявила, что ее модельные вычислительные затраты значительно ниже некоторых передовых крупных моделей API, обеспечивая парето-оптимальный баланс между точностью и затратами.