DGrid AI оприлюднює дослідницький документ PoQ-Judge, скорочуючи витрати на оцінювання якості LLM на 72%

За даними ChainCatcher, DGrid AI сьогодні випустила свій найновіший дослідницький матеріал «PoQ-Judge», представивши багатороздільний фреймворк оцінювання якості, який усуває потребу у еталонних відповідях. Фреймворк досяг кореляції 0,747 із людськими оцінками на відкладених тестових наборах, одночасно знизивши витрати на оцінювання більш ніж на 72% завдяки каскадній оцінці та онлайн-калібруванню ваг. PoQ (Proof of Quality) — це власний механізм консенсусу DGrid, створений для запобігання розгортанню моделей низької якості та маніпуляціям даними на рівні протоколу.
Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів