Artificial Analysis публікує бенчмарк агента для кодування; Zhipu GLM-5.1 посідає перше місце серед моделей із відкритим кодом

Artificial Analysis сьогодні опублікувала новий Coding Agent Index, щоб оцінити, як AI-моделі працюють у поєднанні з агентськими фреймворками на ключових бенчмарках, зокрема SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 і SWE-Atlas-QnA. Zhipu GLM-5.1 посів перше місце серед моделей із відкритим кодом у цьому оцінюванні, продемонструвавши лідерську продуктивність у сценаріях реальних кодингових агентів.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

TT Chain інтегрує систему безпеки AegisAI для захисту RWA 11 травня

Згідно з оголошенням TT Chain від 11 травня, мережа L2 блокчейну інтегрувала AI-інфраструктуру безпеки AegisAI, керовану ШІ, у свою екосистему реальних активів. Співпраця підвищує захист токенізованих транзакцій активів і кросчейн-операцій завдяки розширеному виявленню загроз та можливостям аудиту смартконтрактів. Автономні AI-агенти AegisAI виявляють фішингові атаки, запобігають спробам несанкціонованого доступу та в режимі реального часу ідентифікують уразливості в смартконтрактах. TT Chain за

GateNews50хв. тому

JD.com модернізує власного AI-агента для саморозвитку, приріст користувачів перевищує 300% у 1 кварталі

Згідно з заявою CEO Сю Жань на дзвінку JD.com щодо звітності за 12 травня, компанія комплексно оновлює власнорозробленого AI-агента, щоб точніше виявляти, активувати та зіставляти потреби користувачів. AI-асистент JD.com Jingdong Jingyan збільшив використання користувачами більш ніж на 300% у річному вимірі в першому кварталі.

GateNews1год тому

The Graph запускає платіжну функцію x402, що підтримує доступ до on-chain даних за запитами для USDC 12 травня

Згідно з офіційним оголошенням The Graph від 12 травня, Graph Gateway тепер підтримує x402 Payments, даючи розробникам і AI-агентам доступ до даних у ланцюжку через платежі USDC за запитом без необхідності API-ключів, акаунтів або дашбордів. Користувачі отримують HTTP-відповідь 402, що містить цінову інформацію, а потім завершують платіж у USDC на мережі Base на основі підпису, щоб отримати дані в подальших запитах. Оновлення включає новий endpoint /api/x402/, оновлені платіжні SDK, підтримку ін

GateNews1год тому

SAP інвестує в n8n, подвоюючи оцінку платформи автоматизації робочих процесів до $5,2B

За даними Bloomberg, SAP інвестувала в n8n у вівторок, удвічі підвищивши оцінку платформи автоматизації робочих процесів до 5,2 мільярда доларів. Німецький софтверний гігант також підписав багаторічну партнерську угоду з n8n, щоб інтегрувати інструменти платформи в платформу AI-агентобудови SAP Joule Studio, повідомляє заява SAP.

GateNews2год тому

DAPPOS запускає xBubble — універсальний AI-агент із 10+ ключовими функціями для користувачів без технічних навичок

За даними ChainCatcher, DAPPOS офіційно запустила xBubble — універсальний продукт AI-агента, призначений для користувачів без технічних навичок. Продукт автоматично рекомендує спеціалізованих агентів, щоб виконувати завдання з мінімальними підказками та меншою кількістю ітерацій налагодження. xBubble надає 10+ базових можливостей для створення зображень, відео, документів і вебсайтів, підтримуючи як локальне, так і хмарне розгортання.

GateNews7год тому

Nous Research запускає Hermes Agent для керування комп’ютером у macOS, скорочує споживання токенів на 95%

Nous Research оголосила, що її агент Hermes запустив функціональність керування комп’ютером на macOS, згідно з моніторингом Beating. Функція дає змогу виконувати фонові операції, такі як пошук електронних листів і написання коду, не заважаючи вводу користувача або фокусу на вікні. Завдяки механізму стиснення контексту в чотири шари фреймворк зменшує споживання токенів приблизно з 600 000 до 30 000 токенів під час виконання 20 послідовних операцій із роздільною здатністю 1568×900.

GateNews9год тому
Прокоментувати
0/400
Немає коментарів