Mini Maxs China kembali menantang perang generatif global dengan model AI 'M2.1'

Perusahaan rintisan kecerdasan buatan MiniMax asal Tiongkok meluncurkan model AI baru M2.1, sekali lagi menantang kompetisi AI generatif di seluruh dunia. Model ini secara signifikan memperkuat diversifikasi bahasa pemrograman dan kemampuan respons terhadap lingkungan kerja nyata, tidak hanya dalam hal bantuan kode, tetapi juga menunjukkan peningkatan kinerja yang komprehensif dalam penulisan dokumen dan respons percakapan.

Peluncuran M2.1 kali ini meningkatkan pemahaman dan akurasi generasi untuk berbagai bahasa pemrograman secara signifikan melalui peningkatan kinerja dibandingkan model pendahulu M2. Bahasa yang didukung kini telah diperluas ke Rust, Java, Go, C++, Kotlin, Objective-C, TypeScript, JavaScript, dan lainnya. Kemampuan desain antarmuka pengguna dan estetika di platform Web, Android, dan iOS juga mendapat pujian yang signifikan.

Yang sangat menonjol adalah, M2.1 tidak hanya memperkuat akurasi eksekusi kode sederhana, tetapi juga kemampuan untuk menafsirkan dan mengikuti instruksi tugas kompleks atau panduan terperinci telah ditingkatkan, sehingga membangun AI yang lebih sesuai dengan lingkungan kerja yang nyata. MiniMax untuk itu meningkatkan kemampuan dialog dan kemampuan penulisan dokumen model, dan menjelaskan bahwa ia menunjukkan kinerja yang luar biasa dalam berbagai rentang dari percakapan sehari-hari hingga penulisan dokumen teknis dan respon terstruktur.

CEO dan salah satu pendiri platform open-source Kilo Code, Scott Breitenother, menyatakan: “Dalam pengujian awal, M2.1 menunjukkan hasil yang sangat baik di seluruh proses pengembangan, termasuk desain arsitektur, pengaturan kode, penilaian, dan penyebaran,” dan menilai bahwa model tersebut memenuhi efisiensi biaya dan kinerja tingkat tinggi.

Model ini juga dievaluasi melalui indikator tolok ukur baru yang disebut VIBE (Vision and Interactive Benchmark for Execution). VIBE dibangun berdasarkan lima bidang inti yaitu Web, simulasi, Android, iOS, dan pengembangan backend, dengan melakukan penilaian komprehensif terhadap logika interaksi dan elemen visual dari hasil yang dihasilkan menggunakan bahasa verifikasi berbasis agen. Menurut MiniMax, M2.1 memperoleh rata-rata 88,6 poin dalam pengujian tolok ukur ini, di mana di bidang Web dan Android masing-masing memperoleh skor yang sangat baik yaitu 91,5 poin dan 89,7 poin.

M2.1 juga telah dibandingkan kinerjanya dengan model AI utama. Dalam hasil evaluasi yang berdampingan dengan model utama dari penyedia besar seperti Anthropic, Google, OpenAI, dan DeepSeek, M2.1 menunjukkan kemampuan pemecahan masalah yang kuat dalam tes benchmark yang sangat sulit seperti “Ujian Terakhir Kemanusiaan” dan “Toolathon”. Terutama dalam proyek HLE w/o Tools, M2.1 mendapatkan 22,0 poin, dan dalam tes gabungan MMLU(Pro) di bidang humaniora, sains, dan teknologi, M2.1 mendapatkan 88 poin, sejajar dengan jajaran model AI teratas.

M2.1 saat ini dapat diunduh melalui API MiniMax atau Hugging Face, dan layanan perwakilan perusahaan untuk MiniMax juga berjalan berdasarkan M2.1. Peluncuran model kali ini menunjukkan dukungan pengkodean multibahasa dan pasar agen AI yang sedang berkembang pesat, serta menandakan bahwa universalitas dan daya saing AI generatif yang berasal dari China terus berkembang.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)