
Microsoft pada konferensi Build bulan Juni mengumumkan peluncuran 7 model AI baru, mencakup bidang inferensi, kode, gambar, transkripsi, dan suara. Dalam 4 pengujian inti tolok ukur pemrograman, MAI-Code-1-Flash semuanya mengungguli Claude Haiku 4.5, dan pada SWE-Bench Verified penggunaan Token berkurang hingga 60%.
Daftar 7 model: liputan menyeluruh dalam lima bidang
Konferensi Build Microsoft telah merilis 6 model dengan nama lengkapnya: MAI Thinking-1 (inferensi), MAI Code-1-Flash (kode), MAI Image-2.5 (gambar), MAI Image-2.5-Flash (versi ringkas gambar), MAI Transcribe-1.5 (transkripsi), serta satu model suara; nama lengkap model ke-7 belum sepenuhnya diungkap dalam pemberitaan yang ada. Microsoft menyatakan bahwa model inferensi andalannya, MAI-Thinking-1, kompetitif dalam penalaran dan tugas pengkodean berbasis STEM dibanding model sejenis, namun tidak memberikan data tolok ukur spesifik.
MAI-Code-1-Flash vs Claude Haiku 4.5: data 4 pengujian tolok ukur
MAI-Code-1-Flash memiliki tingkat kelulusan lebih tinggi dari Claude Haiku 4.5 pada 4 pengujian tolok ukur berikut, sekaligus menggunakan lebih sedikit Token:
SWE-Bench Pro: MAI-Code-1-Flash 51,2% vs Claude Haiku 4.5 35,2%, unggul 16 poin
SWE-Bench Verified: penggunaan Token untuk menyelesaikan masalah kompleks berkurang hingga 60%
IF Bench (pelacakan instruksi presisi): MAI-Code-1-Flash unggul 28,9 poin
Advanced IF: MAI-Code-1-Flash unggul 14,5 poin
Dokumen resmi Microsoft menunjukkan bahwa akurasi MAI-Code-1-Flash pada kategori adversarial inti seperti jebakan Einstellung masih di bawah 50%, yang merupakan ruang perbaikan yang telah teridentifikasi.
Cakupan MAI-Code-1-Flash saat ini: pengguna individu tanpa pengaturan tambahan
MAI-Code-1-Flash kini telah dirilis di versi pengguna individu GitHub Copilot di VS Code, dapat digunakan langsung melalui pemilih model, atau diarahkan otomatis oleh Copilot. Model menggunakan kontrol panjang jawaban adaptif: untuk permintaan sederhana tetap ringkas, dan untuk tugas kompleks mengalokasikan lebih banyak sumber daya penalaran. Jadwal penerapan versi perusahaan dan kelompok pengguna lainnya untuk MAI-Code-1-Flash saat ini belum diumumkan.
FAQ
Apa saja 7 model AI baru yang dirilis Microsoft Build 2026?
Yang telah dipublikasikan dengan nama lengkap meliputi MAI Thinking-1, MAI Code-1-Flash, MAI Image-2.5, MAI Image-2.5-Flash, MAI Transcribe-1.5, serta satu model terkait suara, total 6 model; nama lengkap model ke-7 belum sepenuhnya terungkap dalam laporan resmi yang ada.
Bagaimana pengurangan Token 60% pada MAI-Code-1-Flash dicapai?
Microsoft menyatakan bahwa model ini dilatih dengan kontrol panjang jawaban adaptif, yang secara otomatis menyesuaikan kedalaman respons berdasarkan kompleksitas tugas. Hasil pengujian Microsoft pada SWE-Bench Verified menunjukkan bahwa penggunaan Token untuk menyelesaikan masalah kompleks dapat dikurangi hingga 60%.
MAI-Code-1-Flash saat ini terbuka untuk pengguna mana, dan bagaimana jadwal versi perusahaan?
Per Juni 2026, MAI-Code-1-Flash sudah tersedia untuk pengguna individu VS Code GitHub Copilot, tanpa pengaturan tambahan. Microsoft belum mengumumkan jadwal penerapan versi perusahaan atau untuk kelompok pengguna lainnya.