Google запустить Gemini 3.2 Flash на I/O 20 травня, досягнувши продуктивності, як у GPT-5.5, але за 1/15 вартості

AT-5,24%
ON-6,81%
MAY-6,29%
За словами CEO Abacus.AI Бінду Редді, Google планує представити Gemini 3.2 Flash під час своєї конференції I/O 20 травня; за продуктивністю вона досягатиме 92% GPT-5.5 у завданнях із кодування та міркувань, водночас скорочуючи витрати на інференс лише до однієї п’ятнадцятої — однієї двадцятої від показників останньої. Більшість запитів матиме затримку нижче 200 мілісекунд. Редді пов’язав цей прорив із техніками distillation і sparsity від Google: вони стискають «фронтирну» модель до рівня Flash без типового провалу продуктивності, який зазвичай спостерігається під час оптимізації моделей.
Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів