وفقًا لـ Beating، نشرت جوجل بنية التنبؤ متعدد الرموز (MTP) على أجهزة Pixel 9 و Pixel 10، مما أدى إلى تسريع نموذج Gemini Nano v3 الموجود على الجهاز بشكل كبير. زادت البنية الجديدة سرعة الاستدلال بأكثر من 50% مع الحفاظ على توافق السلامة وجودة المخرجات للنموذج.
تتيح آلية عدم النسخ لرأس التنبؤ إعادة استخدام الميزات المخزنة مؤقتًا للنموذج الرئيسي مباشرةً من خلال الانتباه المتقاطع، مما يلغي حمل ذاكرة التخزين المؤقت للمفاتيح والقيم المنفصلة في النماذج الأولية التقليدية. وفر هذا التصميم حوالي 130 ميجابايت من الذاكرة مع تقليل زمن بدء التشغيل. في التطبيقات العملية مثل تلخيص الإشعارات والردود الذكية، حققت MTP زيادة بنسبة 55% في معدل قبول الرموز، مما قلل من تكرار استيقاظ المعالج وخفض استهلاك طاقة النظام.