Microsoft Build merilis 7 model AI, penggunaan tokennya 60% lebih sedikit dibanding pesaing

微軟Build AI模型

Microsoft pada konferensi Build bulan Juni mengumumkan peluncuran 7 model AI baru, mencakup bidang inferensi, kode, gambar, transkripsi, dan suara. Dalam 4 pengujian inti tolok ukur pemrograman, MAI-Code-1-Flash semuanya mengungguli Claude Haiku 4.5, dan pada SWE-Bench Verified penggunaan Token berkurang hingga 60%.

Daftar 7 model: liputan menyeluruh dalam lima bidang

Konferensi Build Microsoft telah merilis 6 model dengan nama lengkapnya: MAI Thinking-1 (inferensi), MAI Code-1-Flash (kode), MAI Image-2.5 (gambar), MAI Image-2.5-Flash (versi ringkas gambar), MAI Transcribe-1.5 (transkripsi), serta satu model suara; nama lengkap model ke-7 belum sepenuhnya diungkap dalam pemberitaan yang ada. Microsoft menyatakan bahwa model inferensi andalannya, MAI-Thinking-1, kompetitif dalam penalaran dan tugas pengkodean berbasis STEM dibanding model sejenis, namun tidak memberikan data tolok ukur spesifik.

MAI-Code-1-Flash vs Claude Haiku 4.5: data 4 pengujian tolok ukur

MAI-Code-1-Flash memiliki tingkat kelulusan lebih tinggi dari Claude Haiku 4.5 pada 4 pengujian tolok ukur berikut, sekaligus menggunakan lebih sedikit Token:

SWE-Bench Pro: MAI-Code-1-Flash 51,2% vs Claude Haiku 4.5 35,2%, unggul 16 poin

SWE-Bench Verified: penggunaan Token untuk menyelesaikan masalah kompleks berkurang hingga 60%

IF Bench (pelacakan instruksi presisi): MAI-Code-1-Flash unggul 28,9 poin

Advanced IF: MAI-Code-1-Flash unggul 14,5 poin

Dokumen resmi Microsoft menunjukkan bahwa akurasi MAI-Code-1-Flash pada kategori adversarial inti seperti jebakan Einstellung masih di bawah 50%, yang merupakan ruang perbaikan yang telah teridentifikasi.

Cakupan MAI-Code-1-Flash saat ini: pengguna individu tanpa pengaturan tambahan

MAI-Code-1-Flash kini telah dirilis di versi pengguna individu GitHub Copilot di VS Code, dapat digunakan langsung melalui pemilih model, atau diarahkan otomatis oleh Copilot. Model menggunakan kontrol panjang jawaban adaptif: untuk permintaan sederhana tetap ringkas, dan untuk tugas kompleks mengalokasikan lebih banyak sumber daya penalaran. Jadwal penerapan versi perusahaan dan kelompok pengguna lainnya untuk MAI-Code-1-Flash saat ini belum diumumkan.

FAQ

Apa saja 7 model AI baru yang dirilis Microsoft Build 2026?

Yang telah dipublikasikan dengan nama lengkap meliputi MAI Thinking-1, MAI Code-1-Flash, MAI Image-2.5, MAI Image-2.5-Flash, MAI Transcribe-1.5, serta satu model terkait suara, total 6 model; nama lengkap model ke-7 belum sepenuhnya terungkap dalam laporan resmi yang ada.

Bagaimana pengurangan Token 60% pada MAI-Code-1-Flash dicapai?

Microsoft menyatakan bahwa model ini dilatih dengan kontrol panjang jawaban adaptif, yang secara otomatis menyesuaikan kedalaman respons berdasarkan kompleksitas tugas. Hasil pengujian Microsoft pada SWE-Bench Verified menunjukkan bahwa penggunaan Token untuk menyelesaikan masalah kompleks dapat dikurangi hingga 60%.

MAI-Code-1-Flash saat ini terbuka untuk pengguna mana, dan bagaimana jadwal versi perusahaan?

Per Juni 2026, MAI-Code-1-Flash sudah tersedia untuk pengguna individu VS Code GitHub Copilot, tanpa pengaturan tambahan. Microsoft belum mengumumkan jadwal penerapan versi perusahaan atau untuk kelompok pengguna lainnya.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar