Согласно сообщению Reuters от 30 июня, Meituan (美团) выпустила открытую ИИ-модель LongCat-2.0 с 1,6 триллиона параметров, использующую разреженную архитектуру смеси экспертов (Sparse MoE) и полностью обученную на кластерах отечественных ASIC-чипов без использования графических процессоров NVIDIA или стека ПО CUDA. Окно контекста модели составляет 1 миллион токенов.
Технические характеристики LongCat-2.0 и целевые сценарии применения
LongCat-2.0 использует разреженную архитектуру смеси экспертов (Sparse MoE), аналогичную решениям DeepSeek и Mixtral от Mistral: модель не активирует все 1,6 триллиона параметров одновременно, вместо этого внутренний роутер выбирает специализированные подмодели для каждого токена, что снижает затраты на инференс по сравнению с плотными моделями аналогичного размера. Основные технические характеристики и ограничения развёртывания:
Количество параметров: 1,6 триллиона (разреженная MoE-архитектура, не все параметры активируются одновременно)
Окно контекста: 1 миллион токенов (DeepSeek-R1-0528 и GPT-OSS — по 128 тыс.)
Оборудование для обучения: отечественный ASIC-суперкластер (без GPU NVIDIA, без стека ПО CUDA)
Целевое применение: ИИ-агенты, инструменты для кодирования (понимание кода, редактирование всей базы, автоматизация задач)
Форма развёртывания: дата-центровый кластер для инференса; не поддерживается на потребительских устройствах и в большинстве локальных развёртываний
Рыночный контекст обучения на отечественных чипах и данные Bernstein
Meituan заявляет, что базовая архитектура инференса LongCat-2.0 переносима и может работать на существующем китайском оборудовании. Релиз происходит на фоне продолжающихся ограничений на экспорт передовых ИИ-чипов в Китай со стороны США.
Согласно оценкам инвестиционной исследовательской компании Bernstein, NVIDIA в настоящее время занимает около 40% китайского рынка ИИ-чипов, что сопоставимо с долей Huawei; Bernstein также прогнозирует, что в этом году Huawei добьётся прогресса, снизив долю NVIDIA на китайском рынке примерно на 8 процентных пунктов.
Текущее состояние заявлений о производительности: стороннее подтверждение отсутствует
В опубликованных бенчмарках Meituan сравнивает LongCat-2.0 с несколькими закрытыми моделями, однако, как отмечается в сообщениях, эти заявления о производительности до сих пор не получили независимой и непредвзятой оценки третьих сторон.
В сообщении также указывается, что оптимизация под отечественные чипы может ограничивать производительность LongCat-2.0 на оборудовании NVIDIA, которое по-прежнему доминирует в глобальных дата-центрах. Meituan заявляет, что базовая архитектура инференса остаётся переносимой, и независимое тестирование определит готовность разработчиков за пределами Китая к её использованию.
Часто задаваемые вопросы
Для каких сценариев имеет значение окно контекста LongCat-2.0 в 1 миллион токенов?
На момент публикации максимальный размер окна контекста DeepSeek-R1-0528 и OpenAI GPT-OSS составлял 128 тыс. токенов; LongCat-2.0 заявляет о 1 миллионе токенов, что потенциально важно для ИИ-агентов, работающих с длинными кодовыми базами и сложными цепочками задач. Однако эти заявления пока ожидают независимой проверки.
Каков опыт Meituan в разработке ИИ?
Основной бизнес Meituan — доставка еды и локальные услуги. В 2023 году компания приобрела ИИ-стартап Light Year Beyond за 281 млн долларов и вошла в сферу ИИ. Лишь в 2025 году Meituan публично объявила о планах внутренних моделей, а LongCat-2.0 позиционируется как движок инференса для ИИ-агентов и инструментов кодирования компании.
Каковы плюсы и минусы разреженной MoE-архитектуры LongCat-2.0 по сравнению с плотной моделью с 1,6 триллиона параметров?
Ключевое преимущество разреженного MoE — неактивация всех параметров и маршрутизация к конкретным подмоделям, что снижает вычислительные затраты на инференс по сравнению с плотной моделью аналогичного размера. Однако архитектура, оптимизированная под конкретное оборудование (например, отечественные ASIC), может иметь ограничения производительности на других устройствах (например, GPU NVIDIA); независимые тесты пока не опубликованы.