Artificial Analysis сегодня выпустила новый Index Coding Agent, чтобы оценить, как AI-модели показывают себя при совместном использовании с агентными фреймворками на ключевых бенчмарках, включая SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 и SWE-Atlas-QnA. Zhipu GLM-5.1 заняла первое место среди открытых моделей в ходе оценки, продемонстрировав лидирующие результаты в реальных сценариях работы кодинговых агентов.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
TT Chain интегрирует систему безопасности AegisAI для защиты RWA 11 мая
Согласно объявлению TT Chain от 11 мая, сеть блокчейна уровня 2 интегрировала в свою экосистему токенизированных реальных активов AI-инфраструктуру безопасности AegisAI, работающую на базе ИИ. Партнёрство усиливает защиту токенизированных операций с активами и кроссчейн-взаимодействий за счёт расширенного обнаружения угроз и возможностей аудита смарт-контрактов. Автономные ИИ-агенты AegisAI выявляют фишинговые атаки, предотвращают попытки несанкционированного доступа и в режиме реального времени
GateNews2ч назад
JD.com обновляет собственный AI-агент, рост числа пользователей превышает 300% в 1 квартале
Генеральный директор Сюй Жань из JD.com на состоявшемся 12 мая в ходе отчётной конференции заявил, что компания всесторонне обновляет созданного ею ИИ-агента, чтобы точнее выявлять, активировать и сопоставлять потребности пользователей. ИИ-помощник JD.com Jingdong Jingyan увеличил пользовательскую активность более чем на 300% в годовом выражении в первом квартале.
GateNews2ч назад
The Graph запускает функцию платежей x402, поддерживающую доступ к on-chain данным по запросу для USDC 12 мая
Согласно официальному объявлению The Graph от 12 мая, Graph Gateway теперь поддерживает платежи x402, позволяя разработчикам и AI Agents получать доступ к данным в сети через одноразовые платежи в USDC без необходимости API-ключей, аккаунтов или дашбордов. Пользователи получают HTTP-ответ 402, содержащий ценовую информацию, затем выполняют платеж в USDC по сети Base на основе подписи, чтобы получать данные в последующих запросах. Обновление включает новый endpoint /api/x402/, обновленные платежн
GateNews2ч назад
SAP инвестирует в n8n, удваивая оценку платформы автоматизации рабочих процессов до 5,2 миллиарда долларов
По данным Bloomberg, SAP инвестировала в n8n во вторник, удвоив оценку платформы автоматизации рабочих процессов до 5,2 миллиарда долларов. Немецкий софтверный гигант также подписал много лет партнерское соглашение с n8n, чтобы интегрировать инструменты платформы в платформу SAP Joule Studio для создания AI-агентов, говорится в заявлении SAP.
GateNews3ч назад
DAPPOS запускает xBubble — универсального AI-агента с 10+ ключевыми функциями для пользователей без технических навыков
Согласно ChainCatcher, DAPPOS официально запустила xBubble — универсальный продукт AI-агента, предназначенный для пользователей без технических навыков. Продукт автоматически рекомендует специализированных агентов для выполнения задач с минимальным количеством запросов и меньшим числом итераций отладки. xBubble предоставляет 10+ ключевых возможностей, включая создание изображений, видео, документов и сайтов, поддерживая как локальное, так и облачное развертывание.
GateNews8ч назад
Nous Research запускает Hermes Agent для управления компьютером на macOS, снижая потребление токенов на 95%
Nous Research объявила, что её агент Hermes запустил функцию удалённого управления компьютером на macOS, по данным наблюдений Beating. Эта функция позволяет выполнять фоновые операции, такие как поиск писем и написание кода, не мешая вводу пользователя и фокусу окна. Благодаря механизму сжатия контекста в четыре слоя фреймворк снижает расход токенов примерно с 600 тыс. до 30 тыс. при выполнении 20 последовательных операций с разрешением 1568×900.
GateNews10ч назад