Meituan LongCat-2.0 с открытым исходным кодом: 1,6 триллиона параметров, не требует GPU NVIDIA

2026-07-01 02:46:54

Согласно сообщению Reuters от 30 июня, Meituan (美团) выпустила открытую ИИ-модель LongCat-2.0 с 1,6 триллиона параметров, использующую разреженную архитектуру смеси экспертов (Sparse MoE) и полностью обученную на кластерах отечественных ASIC-чипов без использования графических процессоров NVIDIA или стека ПО CUDA. Окно контекста модели составляет 1 миллион токенов.

Технические характеристики LongCat-2.0 и целевые сценарии применения

LongCat-2.0 использует разреженную архитектуру смеси экспертов (Sparse MoE), аналогичную решениям DeepSeek и Mixtral от Mistral: модель не активирует все 1,6 триллиона параметров одновременно, вместо этого внутренний роутер выбирает специализированные подмодели для каждого токена, что снижает затраты на инференс по сравнению с плотными моделями аналогичного размера. Основные технические характеристики и ограничения развёртывания:

Количество параметров: 1,6 триллиона (разреженная MoE-архитектура, не все параметры активируются одновременно) Окно контекста: 1 миллион токенов (DeepSeek-R1-0528 и GPT-OSS — по 128 тыс.) Оборудование для обучения: отечественный ASIC-суперкластер (без GPU NVIDIA, без стека ПО CUDA) Целевое применение: ИИ-агенты, инструменты для кодирования (понимание кода, редактирование всей базы, автоматизация задач) Форма развёртывания: дата-центровый кластер для инференса; не поддерживается на потребительских устройствах и в большинстве локальных развёртываний

Рыночный контекст обучения на отечественных чипах и данные Bernstein

Meituan заявляет, что базовая архитектура инференса LongCat-2.0 переносима и может работать на существующем китайском оборудовании. Релиз происходит на фоне продолжающихся ограничений на экспорт передовых ИИ-чипов в Китай со стороны США.

Согласно оценкам инвестиционной исследовательской компании Bernstein, NVIDIA в настоящее время занимает около 40% китайского рынка ИИ-чипов, что сопоставимо с долей Huawei; Bernstein также прогнозирует, что в этом году Huawei добьётся прогресса, снизив долю NVIDIA на китайском рынке примерно на 8 процентных пунктов.

Текущее состояние заявлений о производительности: стороннее подтверждение отсутствует

В опубликованных бенчмарках Meituan сравнивает LongCat-2.0 с несколькими закрытыми моделями, однако, как отмечается в сообщениях, эти заявления о производительности до сих пор не получили независимой и непредвзятой оценки третьих сторон.

В сообщении также указывается, что оптимизация под отечественные чипы может ограничивать производительность LongCat-2.0 на оборудовании NVIDIA, которое по-прежнему доминирует в глобальных дата-центрах. Meituan заявляет, что базовая архитектура инференса остаётся переносимой, и независимое тестирование определит готовность разработчиков за пределами Китая к её использованию.

Часто задаваемые вопросы

Для каких сценариев имеет значение окно контекста LongCat-2.0 в 1 миллион токенов?

На момент публикации максимальный размер окна контекста DeepSeek-R1-0528 и OpenAI GPT-OSS составлял 128 тыс. токенов; LongCat-2.0 заявляет о 1 миллионе токенов, что потенциально важно для ИИ-агентов, работающих с длинными кодовыми базами и сложными цепочками задач. Однако эти заявления пока ожидают независимой проверки.

Каков опыт Meituan в разработке ИИ?

Основной бизнес Meituan — доставка еды и локальные услуги. В 2023 году компания приобрела ИИ-стартап Light Year Beyond за 281 млн долларов и вошла в сферу ИИ. Лишь в 2025 году Meituan публично объявила о планах внутренних моделей, а LongCat-2.0 позиционируется как движок инференса для ИИ-агентов и инструментов кодирования компании.

Каковы плюсы и минусы разреженной MoE-архитектуры LongCat-2.0 по сравнению с плотной моделью с 1,6 триллиона параметров?

Ключевое преимущество разреженного MoE — неактивация всех параметров и маршрутизация к конкретным подмоделям, что снижает вычислительные затраты на инференс по сравнению с плотной моделью аналогичного размера. Однако архитектура, оптимизированная под конкретное оборудование (например, отечественные ASIC), может иметь ограничения производительности на других устройствах (например, GPU NVIDIA); независимые тесты пока не опубликованы.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

22ч назад

Meituan выпускает AI-модель LongCat-2.0 с 1,6 триллиона параметров 30 июня.

06-30 05:07

Huawei выпускает модель openPangu-2.0-Flash в открытый исходный код 30 июня

06-30 03:19

Meituan выпускает LongCat-2.0: модель с 1,6 триллиона параметров входит в топ-3 на OpenRouter

Связанные статьи

Google запустила самую дешевую модель генерации изображений: 0,034 доллара за тысячу изображений

Market Whisper3ч назад

Достижение Meta: точность преобразования мозговых сигналов в текст — 61%, исходный код опубликован как open-source.

Market Whisper22ч назад