За даними CNBC, лідери в галузі AI, зокрема CEO Cognition Скотт Ву та CPO Cisco Джиту Патель, повідомили цього тижня, що маршрутизація моделей — рішення, яке підбирає завдання до відповідних AI-моделей залежно від складності — стає ключовою дисципліною з контролю витрат у корпоративній Америці.
Наразі, за оцінкою CEO Glean Арвінда Джейна, приблизно 95% корпоративного використання AI за замовчуванням переходить на дорогі флагманські моделі навіть для рутинних задач. Маршрутизація моделей може забезпечити у 5–10 разів кращу ефективність витрат на шаблонній роботі завдяки більш дешевим альтернативам. Аналіз витрат Cisco підкреслює напругу: за $200 токенів використання на працівника щотижня компанія стикається приблизно з $900 мільйонами річних витрат на AI для своїх 90 000 співробітників. Якщо компанії дедалі частіше спрямовуватимуть високоволюмні й прості задачі на дешевші або відкриті моделі, OpenAI та Anthropic отримуватимуть оплату лише за складну роботу, потенційно перебудовуючи моделі ціноутворення, на яких обидві компанії вибудували свої оцінки.