Будь-хто, хто займається створенням фізичних AI-систем для автомобілів з автономним керуванням, робототехніки чи розумного виробництва, знає цей кошмар: навчальні дані є рідкісними, надзвичайно дорогими й практично неможливими для масштабування.
З’являється перспективне рішення, яке варто дослідити — розгортання базових моделей світу NVIDIA Cosmos на хмарній інфраструктурі для генерації синтетичних навчальних даних у величезних масштабах. Цей підхід вирішує основну вузьку ланку: замість збору мільйонів реальних сценаріїв (що могло б тривати роки й коштувати статки), ви можете програмно моделювати різноманітні середовища й крайові випадки.
Технічний робочий процес передбачає запуск кластерів GPU, налаштування моделей Cosmos для ваших конкретних фізичних сценаріїв, а потім генерацію фотореалістичних синтетичних датасетів, які охоплюють рідкісні ситуації, що їх не містили ваші реальні дані. Наприклад: автономні транспортні засоби, які стикаються з незвичайними погодними умовами, або роботизовані маніпулятори, що працюють з об’єктами з непередбачуваними властивостями.
Для команд, які застрягли на етапі збору даних, така зміна парадигми може прискорити цикл розробки на місяці й суттєво знизити витрати. Якість синтетичних даних уже досягла такого рівня, що моделі, навчені на них, демонструють співставні результати з тими, що були навчені виключно на реальних даних у багатьох сценаріях.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
12 лайків
Нагородити
12
5
Репост
Поділіться
Прокоментувати
0/400
FreeMinter
· 8год тому
Хаха, справді, збір даних — це просто шалені витрати.
Минулого року спілкувався з другом, який займається автопілотом, і він саме так скаржився... Використати синтетичні дані, щоб одразу зекономити купу грошей? Звучить привабливо, але не знаю, чи не підведе це в реальних умовах.
Зачекай, а цю економію справді можна отримати?
Переглянути оригіналвідповісти на0
MevSandwich
· 20год тому
Чи справді синтетичні дані можуть замінити реальні? Постійно є якесь відчуття штучності...
---
Знову рішення від NVIDIA, ну ясно, далі будуть стригти бабло.
---
Блін, якби це справді так добре працювало, чому тоді автопілоти досі так часто потрапляють у ДТП?
---
GPU-кластери коштують купу грошей, для невеликих команд це все ще серйозний бар’єр.
---
Фотореалістичне, кажете? Ось коли реально виїдуть на дороги, тоді й поговоримо.
---
Цікаво, можна уникнути мороки зі збором даних... Але чи можна гарантувати якість?
---
Почекайте, це ви хочете сказати, що точність симульованих даних вже може зрівнятися з реальними? Не вірю.
Переглянути оригіналвідповісти на0
EternalMiner
· 20год тому
Гм... у сфері synthetic data справді є прогрес, але все одно страшно, що щось піде не так.
Відчуття, що це знову Nvidia щось мутить, лише рекламує свої рішення.
Чи справді в автопілотах наважуються використовувати синтетичні дані... це ж питання безпеки життя.
Цю логіку я чув багато разів, у підсумку все одно витрати великі, а економії майже нема.
Але економія витрат тут дійсно б'є в точку, командам із браком даних, можливо, і справді доведеться цим користуватися.
Переглянути оригіналвідповісти на0
DeFiDoctor
· 20год тому
Записи огляду показують, що ця схема синтетичних даних дійсно допомогла пом'якшити "голод на дані" для фізичного ШІ, але деталі все одно потребують періодичної перевірки. Якщо говорити про зіставлення продуктивності з реальними даними, то з якими саме сценаріями та показниками це порівнюється? Щодо попередження про ризики: чи справді синтетичні дані достатньо покривають крайові випадки, чи це лише здається?
Переглянути оригіналвідповісти на0
¯\_(ツ)_/¯
· 20год тому
Синтетичні дані звучать круто, але на практиці з ними треба бути обережними… У реальних сценаріях усі ці дивні речі модель може й не повністю врахувати.
Будь-хто, хто займається створенням фізичних AI-систем для автомобілів з автономним керуванням, робототехніки чи розумного виробництва, знає цей кошмар: навчальні дані є рідкісними, надзвичайно дорогими й практично неможливими для масштабування.
З’являється перспективне рішення, яке варто дослідити — розгортання базових моделей світу NVIDIA Cosmos на хмарній інфраструктурі для генерації синтетичних навчальних даних у величезних масштабах. Цей підхід вирішує основну вузьку ланку: замість збору мільйонів реальних сценаріїв (що могло б тривати роки й коштувати статки), ви можете програмно моделювати різноманітні середовища й крайові випадки.
Технічний робочий процес передбачає запуск кластерів GPU, налаштування моделей Cosmos для ваших конкретних фізичних сценаріїв, а потім генерацію фотореалістичних синтетичних датасетів, які охоплюють рідкісні ситуації, що їх не містили ваші реальні дані. Наприклад: автономні транспортні засоби, які стикаються з незвичайними погодними умовами, або роботизовані маніпулятори, що працюють з об’єктами з непередбачуваними властивостями.
Для команд, які застрягли на етапі збору даних, така зміна парадигми може прискорити цикл розробки на місяці й суттєво знизити витрати. Якість синтетичних даних уже досягла такого рівня, що моделі, навчені на них, демонструють співставні результати з тими, що були навчені виключно на реальних даних у багатьох сценаріях.