Повідомлення Gate News, 27 квітня — Логан Кілпатрік, старший менеджер з продуктів у Google DeepMind і керівник продукту для Google AI Studio, заявив у X, що кожна компанія, яка створює продукти на основі ШІ, має встановити власні кастомні бенчмарки для вимірювання продуктивності моделей ШІ. Він описав це як метод, щоб покращення моделі "незрівнянно вигідно для вашої компанії" та закликав фаундерів і керівників бізнесу "почати вже завтра."

Наразі більшість компаній покладаються на публічні лідерборди, щоб обирати моделі ШІ, але вони вимірюють загальні можливості, які часто не відповідають конкретним сценаріям бізнесу. Кілпатрік навів приклад компанії з контрактних оглядів, яка найбільше переймається точністю вилучення пунктів — можливості, якої немає в публічних бенчмарках, через що неможливо оцінити продуктивність моделі на цьому завданні. Кастомні бенчмарки мають дві ключові переваги: по-перше, вони дають компаніям змогу оцінювати кожне оновлення кожної моделі порівняно зі своїми бізнес-завданнями та обирати ту модель, яка найкраще працює саме в їхньому реальному випадку використання, а не ту, що загалом займає найвищі місця; по-друге, вони дозволяють компаніям ділитися цими тестовими наборами з постачальниками моделей, що стимулює безперервну оптимізацію в напрямках, які важливі для їхнього бізнесу.

Кілпатрік зазначив, що такі компанії, як Zapier і Sierra, уже впроваджують цей підхід, заявивши, що "тут можна створити дуже багато альфи".

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

04-27 03:21

OpenAI співпрацює з MediaTek і Qualcomm для розробки AI-процесора для смартфонів, Foxconn Connector розпочне виробництво у 2028 році

04-27 01:13

Сем Альтман викладає п’ять операційних принципів OpenAI та сигналізує про можливі майбутні обмеження доступу до можливостей моделей заради безпеки

04-24 12:21

Співзасновник NeoSoul Каелан: Індустрія ШІ має дозволяти існування «іграшок», інновації часто стартують як експериментальні продукти

04-24 09:01

Xpeng і Xiaomi очолюють поштовх у бортовий ШІ на Пекінському автосалоні

04-24 08:13

Інженер OpenAI Клайв Чан Оскаржує Рекомендації щодо Апаратного Забезпечення V4, Посилаючись на Помилки та Невизначеність Порівняно з V3

Поглиблений аналіз

MediaTek отримала великий контракт від Google на 8-е покоління TPU! ASIC-бродіння спричиняє вигоду для трьох ешелонів концептуальних акцій

ChainNewsAbmedia04-27 03:57

JPMorgan: Токенізація перетворить індустрію фондів, але «хороші кейси» настануть через кілька років

Crypto Frontier04-26 16:19

AI-агент уже здатний самостійно відтворювати складні академічні статті: Mollick стверджує, що помилки здебільшого трапляються в людських оригіналах, а не в AI

ChainNewsAbmedia04-26 03:34

Прокоментувати

0/400

Немає коментарів