PANews сообщил 27 февраля, что, согласно Cointelegraph, открытая лаборатория ИИ Sentient объявила о запуске Arena — тестовой среды производственного уровня для оценки эффективности AI-агентов в корпоративных рабочих процессах. Подразделения цифровых активов Pantera Capital и Franklin Templeton присоединились к первому тестовому набору Arena.
Sentient отметил, что Arena — это не статический тест, а тестирует агента ИИ на стандартизированной задаче, моделируя корпоративные условия с помощью длинных документов, неполной информации и противоречивых источников. Платформа отслеживает категории отказов, такие как галлюцинации, отсутствующие доказательства, ошибки цитирования и уязвимости рассуждения, чтобы помочь разработчикам диагностировать проблемы. Arena планирует публиковать сравнительные показатели производительности через публичные таблицы лидеров и публиковать отчёты по тестам, обобщающие распространённые паттерны отказов и исправления.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
Pi Network активирует версию узла 20.2 в преддверии Дня пи
Pi Network выпустила версию узла 20.2 раньше запланированного срока. Обновление было запущено 9 марта — за три дня до ранее объявленного срока 12 марта. Обновление является важным шагом в подготовке проекта к ежегодному празднованию Pi Day
Операторы узлов по всей сети продолжают
Coinfomania13м назад
Стратегия объявления нового плана роста
Strategy объявила о новом плане роста для укрепления своих позиций в экосистеме цифровых активов за счет инвестиций в Bitcoin и разработки новых решений на базе блокчейн для бизнеса, с целью улучшения аналитики данных и управления рисками к 2026 году.
TapChiBitcoin34м назад
Robinhood запускает частный инвестиционный фонд и выходит на Нью-Йоркскую фондовую биржу, CEO вновь подтверждает видение токенизации акций
Генеральный директор Robinhood Влад Тенев объявил о запуске фонда Robinhood Ventures Fund I, целью которого является предоставление розничным инвесторам возможности косвенно инвестировать в популярные частные компании. Несмотря на снижение цены акций на 11% в первый день торгов, компания надеется с помощью технологий блокчейн привлечь больше обычных инвесторов к рынку частных инвестиций.
GateNews46м назад
World Liberty Financial запускает голосование по управлению для включения стейкинга для держателей WLFI
World Liberty Financial вынесла на голосование свою инициативу по включению стейкинга для держателей WLFI, которое продлится следующие семь дней.
Инициатива получила поддержку в размере 99,2%, за нее проголосовало 903 миллиона токенов, против — 5,8 миллиона.
World Liberty Financial недавно представила пр
CryptoNewsFlash51м назад
Blue Fox Notes |Наиболее стратегически ценные Layer2 для Ethereum
Самый стратегически ценный слой 2 в Ethereum, возможно, не заключается в дальнейшем улучшении кошельков и DeFi для людей, а в создании исполнительного слоя специально для AI-агентов. Такой L2 может принести Ethereum настоящий экспоненциальный рост, взрыв активности в сети и сделать Ethereum «доверительным и координирующим уровнем в AI-мире».
Пользователи AI-агентов начинают входить, сейчас на Ethereum активно более 20 000 AI-агентов (взрывной рост произошёл всего через несколько недель после запуска стандарта ERC-8004). Эти агенты не нуждаются в браузерах, мобильных приложениях или «приятном интерфейсе», им нужны высокочастотные микротранзакции, низкая задержка, проверяемые вычисления, защита приватности и межмашинные платежи.
Люди используют L2 для экономии газа и быстрого подтверждения транзакций, а агенты используют L2 для...
区块客1ч назад
Инструмент восстановления токенов BNB Beacon Chain переходит в финальную фазу: что должны знать держатели BEP2
Инструмент восстановления токенов BNB Beacon Chain сейчас находится в первой фазе своего завершения, и обработка за 7 дней будет доступна только до 30 апреля.
Восстановлению подлежат только зеркальные токены BEP2; держатели незеркальных активов рискуют навсегда их потерять.
BNB Chain начал поэтапное отключение BNB Beacon
CryptoNewsFlash1ч назад