Google запустит Gemini 3.2 Flash на I/O 20 мая, обеспечив производительность, сопоставимую с GPT-5.5, при стоимости в 1/15

AT-3,01%
ON-5,66%
MAY-1,9%
Генеральный директор Abacus.AI Бинду Редди заявил, что Google планирует представить Gemini 3.2 Flash на своей конференции I/O 20 мая; при этом производительность достигнет 92% от GPT-5.5 на задачах кодирования и рассуждений, одновременно сократив расходы на инференс до одной-пятнадцатой — одной-двадцатой от показателей последнего. Большинство запросов будут обрабатываться с задержкой ниже 200 миллисекунд. Редди объяснил прорыв дистилляцией и техниками sparsity от Google: они сжимают флагманскую модель до уровня Flash без типичного провала производительности, обычно наблюдаемого при оптимизации моделей.
Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев