Tencent випустила Hy3 у прев’ю-версії з відкритим кодом, тест продуктивності коду порівняно з попередньою версією покращено на 40%

騰訊開源Hy3預覽版

Tencent 23 квітня офіційно відкрила вихідний код великої мовної моделі Hy3 у попередньому прев’ю на платформах GitHub, Hugging Face та ModelScope, а також паралельно надала платні API-послуги у своєму хмарному сервісі Tencent Cloud. Згідно з повідомленням Decrypt від 24 квітня, Hy3 у попередньому прев’ю розпочала тренування в кінці січня, а до дати випуску минуло менше трьох місяців.

Архітектура моделей Hy3 та передумови розробки

Згідно з офіційним оголошенням Tencent, Hy3 у попередньому прев’ю — це змішана архітектура експертів: маршрутизує кожен запит до визначеного підмножини підмереж експертів для обробки, а не вмикає всі параметри синхронно, щоб зменшити обчислювальні потреби.

Кількість параметрів попередньої флагманської моделі Hy2 перевищує 4,000 млрд. У своєму офіційному заявленні Tencent зазначила, що 2,950 млрд — це налаштування після оптимізації ефективності під час інференсу; після цього масштабу додавання параметрів більше не є економічно вигідним через граничний ефект.

За повідомленням Decrypt, тренувальні роботи Hy3 очолив головний науковець з питань штучного інтелекту Tencent Яо Шунью (Yao Shunyu). Після завершення у лютому 2026 року реконструкції базової інфраструктури для попереднього тренування та стеку навчання з підкріпленням Hy3 тренування офіційно стартувало.

Дані ключових тестів

Згідно з результатами базових тестів, розкритими в офіційному оголошенні Tencent:

SWE-bench Verified(виправлення помилок у реальному коді GitHub): Hy3 у попередньому прев’ю 74.4%, Hy2 — 53.0%; у той самий період GLM-5 — 77.8%, Kimi-K2.5 — 76.8%, Claude Opus 4.6 — 80.8%

Terminal-Bench 2.0(виконання підзадач із командного рядка): Hy3 у попередньому прев’ю 54.4%, Hy2 — 23.2%

BrowseComp(складні мережеві пошукові завдання): Hy3 у попередньому прев’ю 67.1%, Hy2 — 28.7%

WideSearch: Hy3 у попередньому прев’ю 70.2%, вище за GLM-5 та Kimi-K2.5, нижче за Claude Opus 4.6 — 77.2%

Академічний іспит на здобуття ступеня доктора математики Тінхуа (2026 весна): середній бал за три запуски (avg@3) 88.4, найвищий показник серед моделей у Китаї

2025 олімпіада з біології для старшокласників Китаю (CHSBO 2025): 87.8 балів, найвищий показник серед подібних моделей у Китаї

Платформи розгортання та ціни на API

Згідно з офіційним оголошенням Tencent, Hy3 у попередньому прев’ю вже розгорнуто на таких платформах: 元寶(Yuanbao)、QQ、Tencent Docs、CodeBuddy、WorkBuddy та OpenClaw.

Ціни на API в хмарі Tencent: 0.18 долара США за кожен мільйон вхідних токенів і 0.59 долара США за кожен мільйон вихідних токенів; щомісячна підписка для індивідуальних планів токенів починається приблизно з 4.10 долара США. Оголошення Tencent також показує, що на CodeBuddy та WorkBuddy перша затримка маркування для Hy3 зменшилась на 54% порівняно з попереднім поколінням, час наскрізного генерування скоротився на 47%, а також агентський робочий процес із 495 кроків успішно завершено.

Поширені запитання

Коли буде випущено попередню версію Tencent Hy3 і на яких платформах її можна отримати?

Згідно з офіційним оголошенням Tencent і повідомленням Decrypt від 24 квітня 2026 року, Hy3 у попередньому прев’ю 23 квітня 2026 року (четвер) відкрила вихідний код на GitHub, Hugging Face та ModelScope, а в хмарі Tencent паралельно надаються платні API-послуги.

Яка основна різниця в результатах ключових тестів між попередньою версією Hy3 та попередником Hy2?

Згідно з офіційним оголошенням Tencent, оцінка SWE-bench Verified зросла з 53.0% для Hy2 до 74.4% для Hy3; BrowseComp — з 28.7% до 67.1%; Terminal-Bench 2.0 — з 23.2% до 54.4%.

Яка ціна на API для попередньої версії Hy3?

Згідно з офіційним прайсингом хмари Tencent, API Hy3 у попередньому прев’ю починається з 0.18 долара США за кожен мільйон вхідних токенів і 0.59 долара США за кожен мільйон вихідних токенів; щомісячна підписка для індивідуальних планів токенів починається приблизно з 4.10 долара США.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Співзасновник NeoSoul Каелан: Індустрія ШІ має дозволяти існування «іграшок», інновації часто стартують як експериментальні продукти

Повідомлення Gate News, 24 квітня — На нещодавньому форумі в Гонконзі з інтелектуальних зашифрованих фінансів співзасновник NeoSoul Каелан поділився міркуваннями щодо оцінювання проєктів ШІ на ранній стадії, в галузі ШІ, що швидко розвивається. Окрім оцінки наявних продуктів, команди мають продемонструвати здатність не відставати від можливостей базової моделі, сказав він.

GateNews10хв. тому

Meta та Amazon Домовилися про Угоду на Багатомільярдну Суму щодо Поставок Чипів Graviton для Розробки ШІ

Повідомлення Gate News, 24 квітня — Meta Platforms і Amazon Web Services (AWS) досягли багатомільярдної угоди, щоб підтримати ініціативи Meta в галузі штучного інтелекту впродовж найближчих років, повідомляє The Wall Street Journal. Згідно з угодою, Meta використовуватиме десятки мільйонів AWS Graviton c

GateNews22хв. тому

DeepSeek V4-Flash піднявся на Ollama Cloud, сервери США: Claude Code, OpenClaw — однокнопкове підключення

Ollama Cloud щойно додав у каталог DeepSeek V4-Flash; виведення виконується на хостингах у США, пропонує три набори команд в один клік для підключення Claude Code, OpenClaw і Hermes. V4-Flash/V4-Pro використовують архітектуру MoE, нативно підтримують 1M контекст і знижують витрати завдяки стисненню Token-wise + розрідженій увазі DSA; за сценарію 1M FLOPs на один token зменшується на 27%, а KV кеш — на 10%. API сумісний з OpenAI ChatCompletions та Anthropic, що робить зручним перемикання між різними робочими процесами та знижує витрати й ризики щодо даних і суверенітету.

ChainNewsAbmedia1год тому

Web3 AI Infrastructure AIW3 Залучає $2M у seed-фінансуванні на чолі з Buffalo Capital

Повідомлення Gate News, 24 квітня — платформа інфраструктури Web3 AI AIW3 оголосила про завершення $2 мільйонного seed-раунду. Раунд очолювала Buffalo Capital, а GalaXin Capital і Three-stones Ventures брали участь як співінвестори. AIW3 переходить до Agent-as-a-Service

GateNews2год тому

Cohere придбає німецьку компанію в галузі ШІ Aleph Alpha та забезпечує $600M інвестицій для європейської експансії

Повідомлення Gate News, 24 квітня — канадська компанія в галузі ШІ Cohere оголосила про плани придбати німецьку компанію в галузі ШІ Aleph Alpha, щоб посилити свою присутність у Європі. Schwarz Group, інвестор Aleph Alpha, планує інвестувати $600 мільйонів у раунд фінансування Series E Cohere. Очікується, що раунд фінансування буде завершено в 202

GateNews2год тому

Xpeng і Xiaomi очолюють поштовх у бортовий ШІ на Пекінському автосалоні

Повідомлення Gate News, 24 квітня — Китайські автовиробники показали передові вбудовані в авто системи ШІ на Пекінському автосалоні 24 квітня, оскільки країна прискорює свою стратегію AI Plus та прагне більшої незалежності від іноземних напівпровідників. Xpeng продемонструвала голосокероване паркування, яке дозволяє водіям «

GateNews3год тому
Прокоментувати
0/400
Немає коментарів