Исполнительный руководитель Google DeepMind: Каждая компания, создающая продукт на основе ИИ, должна разрабатывать собственные индивидуальные бенчмарки

Сообщение Gate News, 27 апреля — Логан Килпатрик, старший менеджер по продуктам в Google DeepMind и руководитель продуктового направления Google AI Studio, заявил в X, что каждая компания, создающая продукты на основе ИИ, должна разработать свои собственные индивидуальные бенчмарки для измерения эффективности ИИ-моделей. Он описал это как метод, позволяющий тому, чтобы улучшения модели «несоразмерно приносили выгоду вашей компании», и призвал основателей и руководителей бизнеса «начать уже завтра».

Большинство компаний сейчас полагаются на публичные лидерборды для выбора ИИ-моделей, но они измеряют общие возможности, которые часто не соответствуют конкретным сценариям бизнеса. Килпатрик привел пример компании по проверке контрактов, которая больше всего обеспокоена точностью извлечения пунктов — возможностью, отсутствующей в публичных бенчмарках, из-за чего невозможно оценить эффективность модели при выполнении этой задачи. Индивидуальные бенчмарки дают два ключевых преимущества: во-первых, они позволяют компаниям оценивать каждое обновление модели по своим бизнес-задачам и выбирать ту модель, которая лучше всего работает в их реальном сценарии использования, а не ту, что занимает наивысшее место в общем рейтинге; во-вторых, они позволяют компаниям делиться этими наборами тестов с поставщиками моделей, что способствует постоянной оптимизации в тех областях, которые важны для их бизнеса.

Килпатрик отметил, что такие компании, как Zapier и Sierra, уже внедряют этот подход, заявив, что «здесь можно создать много „альфы“».

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Gemini запускает агентский трейдинг для крипто-счетов, управляемых ИИ

Запуск агентского трейдинга В понедельник компания Gemini развернула Agentic Trading — функцию, которая позволяет пользователям подключать такие AI-модели, как Claude и ChatGPT, напрямую к своим торговым счетам, согласно объявлению, которым поделилось The Block. Функция позволяет AI автономно отслеживать рынки, размещать

CryptoFrontierТолько Сейчас

Министерство обороны США добавило модель Gemini в портал по ИИ

Новость Gate, 27 апреля — Министерство обороны США добавило модель Gemini от Google в свой портал по искусственному интеллекту, расширив инструменты, доступные для применения в оборонных технологиях.

GateNews24м назад

Мошеннические приемы с дипфейками в арсенале со стороны разработчика Cardano раскрывают новую уязвимость

Разработчик Cardano говорит, что реалистичный AI-дипфейк видеозвонок привёл к взлому ноутбука — напоминание о том, что следующая волна криптоатак может начинаться с лиц и голосов, а не с умных контрактов. Предупреждение, опубликованное для сообщества Cardano, описывает инцидент, в котором мошенник использовал

DailyCoin29м назад

Alphea запускает AI-native блокчейн уровня 1 с автономным исполнением агентов

Gate News-сообщение, 27 апреля — Alphea, недавно представленная платформа уровня 1 (Layer 1) для инфраструктуры ИИ, официально представила свою децентрализованную среду выполнения на Гонконгском Web3-фестивале 2026. Платформа объединяет выполнение, долговременную память и проверяемые вычисления в качестве базовых функций уровня блокчейна, а не опциональных компонентов уровня приложений, позволяя автономным ИИ-агентам работать независимо, как

GateNews47м назад

Ethereum обгоняет S&P 500 на 1 696 базисных пунктов с начала конфликта США и Ирана, заявляет Том Ли

Сообщение Gate News, 27 апреля — Том Ли, председатель Bitmine, заявил, что Ethereum обогнал индекс S&P 500 (эталонный индекс акций США) на 1 696 базисных пунктов с начала конфликта США и Ирана, став лучшим по результатам отдельным активом в мире, за исключением сырой нефти. По словам Ли, у ETH проявились характеристики актива «убежища во время войны».

GateNews55м назад

OpenClaw выпускает v2026.4.25 с крупным обновлением TTS и шестью новыми провайдерами голосовых сервисов

Сообщение Gate News, 27 апреля — OpenClaw выпустила v2026.4.25 согласно официальному changelog на GitHub. Обновление включает комплексные улучшения в модулях голоса, плагинов, наблюдаемости и автоматизации браузера. Система TTS теперь поддерживает шесть новых провайдеров голосовых сервисов: Azure Speech,

GateNews1ч назад
комментарий
0/400
Нет комментариев