Microsoft Memperkenalkan SLM Multimodal yang Dilatih pada GPU NVIDIA

CryptosHeadlines

2025-02-27 04:10:58

James Ding

26 Feb 2025 15:38

Microsoft memperkenalkan Phi SLM baru, termasuk Phi-4 multimodal, terlatih di GPU NVIDIA, meningkatkan kemampuan AI dengan penggunaan sumber daya yang efisien.

Microsoft telah mengumumkan penambahan terbaru ke keluarga Phi nya dari model bahasa kecil (SLMs), menampilkan model Phi-4-multimodal dan Phi-4-mini baru, keduanya dilatih menggunakan GPU NVIDIA. Pengembangan ini menandai langkah signifikan dalam evolusi model bahasa, berfokus pada efisiensi dan keberagaman, menurut NVIDIA.

Kemajuan dalam Model Bahasa Kecil

SLM telah muncul sebagai solusi praktis untuk tantangan yang ditimbulkan oleh model bahasa besar (LLMs), yang, meskipun memiliki kemampuan, memerlukan sumber daya komputasi yang substansial. SLM dirancang untuk beroperasi secara efisien dalam lingkungan terbatas, sehingga cocok untuk diimplementasikan pada perangkat dengan memori terbatas dan daya komputasi.

Model multimodal Phi-4 baru Microsoft sangat mencolok karena kemampuannya dalam memproses berbagai jenis data, termasuk teks, audio, dan gambar. Kemampuan ini membuka kemungkinan baru untuk aplikasi seperti pengenalan suara otomatis, terjemahan, dan penalaran visual. Pelatihan model melibatkan 512 GPU NVIDIA A100-80GB selama 21 hari, menekankan upaya komputasi intensif yang diperlukan untuk mencapai kemampuannya.

Phi-4-multimodal dan Phi-4-mini

Model multimodal Phi-4 menawarkan 5,6 miliar parameter dan telah menunjukkan kinerja superior dalam pengenalan suara otomatis, peringkat pertama di papan peringkat OpenASR Huggingface dengan tingkat kesalahan kata 6,14%. Pencapaian ini menyoroti potensi model dalam meningkatkan teknologi pengenalan suara.

Selain Phi-4-multimodal, Microsoft juga memperkenalkan Phi-4-mini, sebuah model teks saja yang dioptimalkan untuk aplikasi obrolan. Dengan 3,8 miliar parameter, Phi-4-mini dirancang untuk menangani konten berbentuk panjang secara efisien, menawarkan jendela konteks 128K token. Pelatihannya melibatkan 1024 GPU NVIDIA A100 80GB selama 14 hari, mencerminkan fokus model pada data dan kode pendidikan berkualitas tinggi.

Penempatan dan Aksesibilitas

Kedua model tersebut tersedia di Azure AI Foundry milik Microsoft, yang menyediakan platform untuk merancang, menyesuaikan, dan mengelola aplikasi kecerdasan buatan. Pengguna juga dapat menjelajahi model-model ini melalui Katalog API NVIDIA, yang menawarkan lingkungan uji coba untuk menguji dan mengintegrasikan model-model ini ke berbagai aplikasi.

Kolaborasi NVIDIA dengan Microsoft tidak hanya sebatas melatih model-model ini. Kemitraan ini mencakup mengoptimalkan perangkat lunak dan model seperti Phi untuk mempromosikan transparansi kecerdasan buatan dan mendukung proyek sumber terbuka. Kolaborasi ini bertujuan untuk memajukan teknologi kecerdasan buatan di berbagai industri, mulai dari perawatan kesehatan hingga ilmu kehidupan.

Untuk informasi lebih detail, kunjungi blog NVIDIA.

Sumber gambar: Shutterstock

Lihat Asli

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Komentar

0/400

Tidak ada komentar