Повідомлення Gate News, 27 квітня — Логан Кілпатрік, старший менеджер з продуктів у Google DeepMind і керівник продукту для Google AI Studio, заявив у X, що кожна компанія, яка створює продукти на основі ШІ, має встановити власні кастомні бенчмарки для вимірювання продуктивності моделей ШІ. Він описав це як метод, щоб покращення моделі “незрівнянно вигідно для вашої компанії” та закликав фаундерів і керівників бізнесу “почати вже завтра.”
Наразі більшість компаній покладаються на публічні лідерборди, щоб обирати моделі ШІ, але вони вимірюють загальні можливості, які часто не відповідають конкретним сценаріям бізнесу. Кілпатрік навів приклад компанії з контрактних оглядів, яка найбільше переймається точністю вилучення пунктів — можливості, якої немає в публічних бенчмарках, через що неможливо оцінити продуктивність моделі на цьому завданні. Кастомні бенчмарки мають дві ключові переваги: по-перше, вони дають компаніям змогу оцінювати кожне оновлення кожної моделі порівняно зі своїми бізнес-завданнями та обирати ту модель, яка найкраще працює саме в їхньому реальному випадку використання, а не ту, що загалом займає найвищі місця; по-друге, вони дозволяють компаніям ділитися цими тестовими наборами з постачальниками моделей, що стимулює безперервну оптимізацію в напрямках, які важливі для їхнього бізнесу.
Кілпатрік зазначив, що такі компанії, як Zapier і Sierra, уже впроваджують цей підхід, заявивши, що “тут можна створити дуже багато альфи”.
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до
Застереження.
Пов'язані статті
Gemini запускає агентську торгівлю для керованих ШІ криптоакаунтів
Запуск агентного трейдингу
У понеділок Gemini запустила Agentic Trading — функцію, яка дозволяє користувачам під’єднувати моделі ШІ, такі як Claude і ChatGPT, безпосередньо до своїх торгових акаунтів, згідно з оголошенням, яке було надіслано The Block. Ця функція дає змогу ШІ автономно стежити за ринками, розміщувати
CryptoFrontierЩойно
Міністерство оборони США додає модель Gemini до AI-порталу
Повідомлення Gate News, 27 квітня — Міністерство оборони США додало модель Gemini від Google до свого порталу для штучного інтелекту, розширивши набір інструментів, доступних для застосувань у сфері оборонних технологій.
GateNews24хв. тому
Діпфейк-дзвінок обманює розробника Cardano, викриває нову слабку ланку
Розробник Cardano заявляє, що реалістичний AI-відеодзвінок із дипфейком призвів до компрометації ноутбука — нагадування про те, що наступна хвиля криптоатак може починатися з облич і голосів, а не зі smart contract’ів.
Попередження, поширене серед спільноти Cardano, описує інцидент, у якому самозванець використав
DailyCoin29хв. тому
Alphea запускає AI-орієнтований блокчейн рівня 1 із виконанням автономних агентів
Повідомлення Gate News, 27 квітня — Alphea, новий представлений блокчейн рівня 1, створений для інфраструктури ШІ, офіційно представила своє децентралізоване середовище виконання на Гонконгському Web3-фестивалі 2026. Платформа інтегрує виконання, персистентну пам’ять і верифіковані обчислення як
GateNews47хв. тому
Ethereum випереджає S&P 500 на 1 696 базисних пунктів з часу конфлікту США—Іран, — Том Лі
Повідомлення Gate News, 27 квітня — Том Лі, голова Bitmine, заявив, що Ethereum обігнав індекс S&P 500 (U.S. benchmark equity index) на 1 696 базисних пунктів з початку конфлікту США—Іран, зробивши його найкращим за результативністю одиночним активом у світі, окрім сирої нафти. За словами Лі, ETH продемонстрував
GateNews54хв. тому
OpenClaw випускає v2026.4.25 із масштабним оновленням TTS та шістьма новими постачальниками голосових сервісів
Повідомлення Gate News, 27 квітня — OpenClaw випустив v2026.4.25 згідно з офіційним журналом змін (changelog) на GitHub. Оновлення містить комплексні покращення в модулях голосу, плагінів, спостережуваності та автоматизації браузера. Система TTS тепер підтримує шість нових постачальників голосових сервісів: Azure Speech,
GateNews1год тому