Abacus.AIのCEOビンドゥ・レディによると、Googleは5月20日のI/OカンファレンスでGemini 3.2 Flashを発表する予定で、コーディングおよび推論タスクにおいてGPT-5.5の92%の性能に到達しつつ、推論コストを後者の1/15〜1/20にまで引き下げるという。ほとんどのクエリはレイテンシが200ミリ秒未満になる見込み。レディは、このブレークスルーをGoogleの蒸留(distillation)とスパース性(sparsity)の手法に起因すると説明し、これらによりフロンティアモデルをFlashティアへ圧縮することで、通常モデル最適化で見られるような性能の急落(パフォーマンス・クリフ)を伴わずに済むとしている。
免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、
免責事項をご確認ください。