Meituan LongCat-2.0 відкритий код: 1,6 трильйона параметрів без GPU NVIDIA

Як повідомляє Reuters 30 червня, Meituan випустила відкриту AI-модель LongCat-2.0 з 1,6 трильйона параметрів, використовуючи архітектуру Sparse Mixture of Experts (MoE), повністю навчену на вітчизняних ASIC-суперкластерних чіпах без використання GPU NVIDIA або програмного стеку CUDA. Контекстне вікно моделі становить 1 мільйон токенів.

Технічні характеристики LongCat-2.0 та цільові сценарії застосування

LongCat-2.0 використовує архітектуру Sparse Mixture of Experts (MoE), подібну до рішень DeepSeek та Mixtral від Mistral: модель не активує всі 1,6 трильйона параметрів одночасно, натомість внутрішній маршрутизатор вибирає набір спеціалізованих підмоделей для кожного токена, що знижує витрати на логіку порівняно зі щільною моделлю такого ж розміру. Основні технічні характеристики та обмеження розгортання:

Кількість параметрів: 1,6 трильйона (архітектура Sparse MoE, не всі параметри активовані одночасно)

Контекстне вікно: 1 мільйон токенів (DeepSeek-R1-0528 та GPT-OSS мають 128 тис. токенів)

Обладнання для навчання: вітчизняний ASIC-суперкластер (без GPU NVIDIA, без програмного стеку CUDA)

Цільове застосування: AI-агенти, інструменти кодування (розуміння коду, редагування всієї бази, автоматизація завдань)

Форма розгортання: кластер логіки рівня дата-центру, не підтримує споживчі пристрої або більшість локальних розгортань

Ринковий контекст навчання на вітчизняних чіпах та дані Bernstein

Meituan стверджує, що основна архітектура логіки LongCat-2.0 є переносимою і може працювати на наявному апаратному забезпеченні в Китаї. Цей реліз відбувається на тлі триваючих обмежень експорту з боку США, які обмежують постачання передових AI-чіпів китайським компаніям.

Аналітична компанія Bernstein оцінює, що NVIDIA наразі займає близько 40% ринку AI-чіпів у Китаї, а Huawei має приблизно таку ж частку; Bernstein також прогнозує, що Huawei цього року досягне прогресу, що призведе до зниження частки NVIDIA на китайському ринку приблизно на 8 відсоткових пунктів.

Поточний стан заяв про продуктивність: немає сторонньої верифікації

Meituan порівняла LongCat-2.0 з декількома закритими моделями в опублікованих тестах, але повідомлення вказують, що ці заяви про продуктивність досі не отримали незалежної та неупередженої сторонньої оцінки.

У звітах також зазначається, що оптимізація під вітчизняні чіпи може обмежувати продуктивність LongCat-2.0 на обладнанні NVIDIA, яке наразі домінує в дата-центрах по всьому світу. Meituan заявляє, що її основна архітектура логіки залишається переносимою, і незалежні тести визначать бажання розробників за межами Китаю використовувати модель.

Поширені запитання

Для яких сценаріїв застосування має значення контекстне вікно LongCat-2.0 в 1 мільйон токенів?

Станом на момент звіту, контекстні вікна DeepSeek-R1-0528 та OpenAI GPT-OSS обмежені 128 тис. токенів; LongCat-2.0 заявляє про 1 мільйон токенів, що потенційно важливо для AI-агентів, які потребують обробки дуже довгих кодових баз та складних ланцюжків завдань. Втім, вищезазначені технічні характеристики потребують незалежної верифікації.

Який фон AI-досліджень у Meituan?

Основний бізнес Meituan — доставка їжі та послуги місцевого життя. У 2023 році компанія придбала AI-стартап Light Year Beyond за 281 мільйон доларів, увійшовши в галузь AI, а в 2025 році публічно оголосила про плани щодо внутрішньої моделі. LongCat-2.0 позиціонується як рушій логіки для AI-агентів та інструментів кодування компанії.

Які переваги та недоліки архітектури Sparse MoE LongCat-2.0 порівняно зі щільною моделлю на 1,6 трильйона параметрів?

Основна перевага Sparse MoE полягає в тому, що вона не активує всі параметри, а маршрутизує до спеціалізованих підмоделей, що знижує обчислювальні витрати на логіку порівняно зі щільною моделлю такого ж розміру. Однак архітектура, оптимізована для конкретного обладнання (наприклад, вітчизняних ASIC), може мати обмеження продуктивності на іншому обладнанні (наприклад, GPU NVIDIA). Незалежні результати тестування ще не опубліковані.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів