Китайський Міні Макс знову кидає виклик глобальній генеративній війні за допомогою AI-моделі 'M2.1'

Китайська стартап-компанія штучного інтелекту MiniMax випустила нову модель AI M2.1, знову кинула виклик глобальній конкуренції у сфері генеративного AI. Ця модель суттєво посилила різноманітність мов програмування та здатність реагувати на реальні робочі умови, демонструючи всебічне покращення продуктивності не лише в допомозі з кодом, але й у написанні документів та відповіді на запитання.

Цей випуск M2.1 значно покращив розуміння та точність генерації для різних мов програмування завдяки перевищенню продуктивності попередньої моделі M2. Підтримувані мови тепер включають Rust, Java, Go, C++, Kotlin, Objective-C, TypeScript, JavaScript тощо. Його здатність до проектування та естетики користувацьких інтерфейсів на платформах Web, Android, iOS також отримала значно покращені відгуки.

Особливо виділяється те, що M2.1 не лише зміцнив правильність виконання простого коду, але й покращив свою здатність інтерпретувати та дотримуватися складних завдань чи детальних інструкцій, що призвело до створення штучного інтелекту, більш відповідного реальному робочому середовищу. MiniMax підвищив здібності моделі в спілкуванні та написанні документів, і зазначив, що вона демонструє відмінні результати в широкому діапазоні, від повсякденного спілкування до написання технічних документів і структурованих відповідей.

Співзасновник та генеральний директор відкритої платформи AI-агентів Kilo Code Скотт Брейтенотер заявив: “На етапі початкових тестувань M2.1 продемонстрував надзвичайні результати в усіх етапах розробки, таких як архітектурне проектування, організація коду, рецензування, розгортання тощо”, і оцінив, що ця модель одночасно відповідає критеріям витратної ефективності та високої продуктивності.

Ця модель також оцінюється за новим показником, який називається VIBE (Vision and Interactive Benchmark for Execution). VIBE побудований на п'яти основних сферах: веб, моделювання, Android, iOS та розробка бекенду, і здійснює комплексну оцінку інтерактивної логіки та візуальних елементів згенерованих результатів за допомогою мови верифікації на основі агентів. Згідно з MiniMax, M2.1 отримав середню оцінку 88.6 у цьому тестуванні, при цьому в веб- та Android-сферах він досягнув відмінних результатів 91.5 та 89.7 відповідно.

M2.1 також провела порівняння продуктивності з основними AI-моделями. У результатах оцінки, проведеної в порівнянні з провідними моделями основних постачальників, таких як Anthropic, Google, OpenAI, DeepSeek, M2.1 також продемонструвала потужні можливості вирішення проблем у складних тестах, таких як “Останній екзамен людства” та “Toolathon”. Зокрема, у проекті HLE w/o Tools вона отримала 22,0 бали, а в комплексному тесті MMLU(Pro) у галузі гуманітарних наук, науки та технологій отримала 88 балів, що ставить її на один рівень з провідними AI-моделями.

M2.1 наразі доступна через власний API MiniMax або Hugging Face, представники компанії, що обслуговують MiniMax, також базуються на M2.1. Випуск цієї моделі демонструє прискорений розвиток підтримки мультимовного кодування та ринку AI-агентів, а також вказує на те, що універсальність і конкурентоспроможність генеративного AI, що походить з Китаю, продовжує розширюватися.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити