DGrid AI оприлюднює дослідницький документ PoQ-Judge, скорочуючи витрати на оцінювання якості LLM на 72%

2026-06-15 14:04:18

За даними ChainCatcher, DGrid AI сьогодні випустила свій найновіший дослідницький матеріал «PoQ-Judge», представивши багатороздільний фреймворк оцінювання якості, який усуває потребу у еталонних відповідях. Фреймворк досяг кореляції 0,747 із людськими оцінками на відкладених тестових наборах, одночасно знизивши витрати на оцінювання більш ніж на 72% завдяки каскадній оцінці та онлайн-калібруванню ваг. PoQ (Proof of Quality) — це власний механізм консенсусу DGrid, створений для запобігання розгортанню моделей низької якості та маніпуляціям даними на рівні протоколу.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

10год тому

Moonshot AI запускає Kimi K2.7 з відкритим кодом HighSpeed, у 6 разів швидше завдяки подвійному тарифу за API

10год тому

Оновлення Gate AI: стратегії від ідеї до коду — потужне підсилення, підтримка генерації коду стратегій природною мовою в одному місці

17год тому

Zhipu запускає флагманську модель GLM-5.2 із вікном контексту 1 млн та планує відкрити її код під ліцензією MIT

18год тому

Baidu DuMate скорочує споживання токенів на 75% після оновлення Core Engine

06-14 03:33

OpenRouter запускає модель Fusion, яка відповідає Fable 5 за точністю за половину вартості, набирає 69% проти 65,3%

Поглиблений аналіз