Кинути виклик монополії програмного забезпечення AI від NVIDIA! Modular створює кросапаратну інтеграцію AI платформу для протистояння CUDA

robot
Генерація анотацій у процесі

У цей момент, коли генеративний ІІ повністю охоплює світ, майже всі LLM, хмарні сервіси та нові ІІ стартапи не можуть обійтися без однієї й тієї ж ключової інфраструктури, а саме програмної екосистеми CUDA від NVIDIA (. Ця архітектура, спочатку створена для відеокарт, за останні два десятиліття поступово розширилася до «невидимої операційної системи» реальної роботи в індустрії ІІ.

Заснована в 2022 році стартап-компанія Modular намагається кинути виклик цій високозосередженій структурі, що контролюється єдиним постачальником. Метою Modular є не створення нового чіпа, а розробка «переносної платформи програмного забезпечення для ШІ», яка дозволить AI-моделям вільно переміщатися між різними GPU та прискорювачами, більше не застрягаючи в екосистемі NVIDIA та CUDA.

2022 рік, початок підприємництва, інженер нижнього рівня прямує до ядра CUDA

Modular була заснована у 2022 році двома інженерами програмного забезпечення з Apple та Google. Генеральний директор Кріс Латтнер створив Swift та LLVM компілятор, а співзасновник Тім Девіс брав участь у розробці критично важливої архітектури програмного забезпечення Google TPU.

Обидва вони особисто пережили процес, як нове обладнання “відкриває ринок завдяки програмному забезпеченню”, тому вирішили залишити великі технологічні компанії та безпосередньо кинути виклик програмному монополізму AI, що представляє CUDA. Ця асиметрична війна здається божевільною в очах галузі, але саме через глибоке розуміння системного підґрунтя їх вважають однією з небагатьох команд, які мають шанс спробувати.

CUDA важко замінити, структурні обмеження в індустрії ШІ

CUDA спочатку була лише інструментом для програмування графічних карт, але з ростом глибокого навчання вона поступово розширилася до повноцінної екосистеми, що охоплює мови, бібліотеки, компілятори та рушії висновку.

Для більшості AI-команд, використання графічних процесорів NVIDIA практично неминуче супроводжується CUDA. Навіть якщо на ринку є графічні процесори AMD, TPU або чіпи, розроблені хмарними постачальниками, за кожним видом апаратного забезпечення все ще стоять спеціалізовані програмні рішення, тому розробники, звичайно, схиляються до вибору найдосвідченішої та найповнішої інструментальної платформи CUDA, що формує високо закріплену структуру галузі.

Інженерія без стимулів стала слабким місцем.

Латнер зазначає, що портативне AI програмне забезпечення, яке працює на різних чіпах і від різних постачальників, не є неважливим, а просто «ніхто не має достатніх стимулів нести витрати». Такі проекти надзвичайно складні, термін окупності дуже довгий, і в короткостроковій перспективі майже неможливо побачити комерційні результати, хоча це здатність, яку в усьому секторі з нетерпінням прагнуть.

Саме цей парадокс спонукає Modular вирішити інвестувати в довгострокову розробку базової системи до вибуху генеративного ШІ, а також навмисно триматися подалі від уваги ринку в перші три роки після свого заснування.

Три роки стриманого праці, капітал і команда поступово на місці

До 2025 року Modular залучив приблизно 380 мільйонів доларів США, інвесторами стали кілька провідних венчурних капіталістів з Силіконової долини. Після завершення останнього раунду фінансування в вересні 2025 року, оцінка компанії склала приблизно 1,6 мільярда доларів США.

Ці ресурси дозволяють Modular залучати досвідчених інженерів з Google та Apple, формуючи команду, яка зосереджена на компіляторах, системному програмному забезпеченні та інфраструктурі ШІ, продовжуючи вдосконалювати повний стек програмного забезпечення.

Три рівні програмної архітектури, від мови до обчислювального кластера

Технічне ядро Modular складається з трьох рівнів, а саме:

Найвищий рівень: для Mammoth, використовується для допомоги підприємствам у розподілі та управлінні обчислювальною потужністю в середовищі з багатьма GPU та постачальниками, вирішуючи проблеми реального впровадження та обслуговування.

Середній шар: це MAX інференційний двигун, відповідальний за фактичне виконання моделі, вже підтримує NVIDIA, AMD та Apple Silicon.

Нижній рівень: для мови програмування Mojo, синтаксис близький до Python, продуктивність наближена до C++, може інтегруватися з основними AI фреймворками.

2025 ключова верифікація, єдиний обчислювальний рівень офіційно сформований

У вересні 2025 року Modular оголосила про ключові результати тестування, які продемонстрували на одному програмному забезпеченні одночасну роботу графічних процесорів NVIDIA Blackwell B200 і AMD MI355X з високою продуктивністю, при цьому MI355X показав навіть приблизно на 50% кращі результати в порівнянні з рідним програмним забезпеченням AMD.

Потім, 12/22, було офіційно випущено Modular Platform 25.6, який повністю підтримує дата-центри та споживчі GPU, і вперше дозволяє Mojo безпосередньо підтримувати Apple Silicon. Офіційно це описується як «Напишіть один раз, запускайте будь-де», тобто:

«Розробники, які написали код на Mojo, не повинні писати окрему версію для NVIDIA, AMD та Apple Silicon, одна і та ж програма може виконуватись на різних GPU та апаратному забезпеченні від різних постачальників.»

Символізує єдність, AI обчислювальний шар переходить від концепції до реального втілення.

Ця стаття кидає виклик монополії програмного забезпечення AI від NVIDIA! Modular створює платформу інтеграції AI через різне апаратне забезпечення для протистояння CUDA, вперше з'явившись у Chain News ABMedia.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів