Model Bahasa Kecil (SLM) Dipromosikan Menjadi Hal Besar Berikutnya dalam AI

Cryptopolitan

Sementara perusahaan-perusahaan mengalirkan uang ke dalam model bahasa besar (LLM), beberapa ahli industri di sektor AI percaya bahwa model bahasa kecil (SLM) akan menjadi tren selanjutnya.

Ini terjadi ketika aktivitas di industri terus tumbuh menjelang musim liburan dengan perusahaan teknologi menginvestasikan lebih banyak dana untuk mengembangkan teknologi mereka.

Masa depan ada pada model bahasa kecil

Seperti xAI yang dijalankan oleh multi-miliarder Elon Musk berhasil mengumpulkan tambahan $5 miliar dari Andreessen Horowitz, Qatar Investment Authority, Sequoia, dan Valor Equity Partners, sementara Amazon menginvestasikan tambahan $4 miliar di Anthropic, pesaing OpenAI.

Sementara perusahaan teknologi besar ini dan yang lainnya menginvestasikan miliaran dolar untuk mengembangkan LLM besar yang fokus pada menangani berbagai tugas, kenyataannya adalah bahwa AI tidak ada satu ukuran yang cocok untuk semua karena ada kebutuhan untuk model-model khusus tugas untuk bisnis.

Menurut chief utive officer AWS Matt Garman dalam rilis tentang perluasan kemitraan dan investasi mereka, sudah ada respons yang luar biasa dari pelanggan AWS yang sedang mengembangkan generative AI yang didukung oleh Anthropic.

LLMs untuk sebagian besar perusahaan masih menjadi pilihan utama untuk proyek tertentu, tetapi untuk yang lain, pilihan ini bisa mahal dalam biaya, energi, dan sumber daya komputasi.

Steven McMillan presiden dan CEO Teradata yang telah menawarkan jalur alternatif bagi beberapa bisnis juga memiliki pandangan lain. Dia yakin masa depan ada pada SLMs.

“Ketika kita melihat ke masa depan, kita berpikir bahwa model bahasa kecil dan menengah serta lingkungan yang terkontrol seperti LLM khusus domain, akan memberikan solusi yang jauh lebih baik.”

~ McMillan

SLM menghasilkan output yang disesuaikan pada jenis data tertentu karena model bahasa dilatih secara khusus untuk melakukan hal tersebut. Karena data yang dihasilkan oleh SLM disimpan secara internal, maka model bahasa dilatih pada data yang berpotensi sensitif.

Dengan LLM yang konsumsi energi, versi bahasa kecil dilatih untuk mengatur baik penggunaan komputasi maupun energi sesuai dengan kebutuhan proyek yang sebenarnya. Dengan penyesuaian seperti itu, berarti SLM efisien dengan biaya yang lebih rendah daripada model besar saat ini.

Bagi pengguna yang ingin menggunakan AI untuk pengetahuan tertentu, ada opsi LLM khusus domain karena mereka tidak menawarkan pengetahuan yang luas. LLM ini dilatih untuk memahami dengan mendalam hanya satu kategori informasi dan memberikan respons yang lebih akurat, misalnya antara CMO dan CFO, dalam domain tersebut.

Mengapa SLM menjadi pilihan yang disukai

Menurut Asosiasi Ilmuwan Data (ADaSci), mengembangkan sepenuhnya SLM dengan 7 miliar parameter untuk sejuta pengguna hanya membutuhkan 55,1MWh (Megawatt hour).

ADaSci menemukan bahwa pelatihan GPT-3 dengan 175 miliar parameter mengonsumsi sekitar 1.287MWh listrik dan daya tersebut tidak termasuk ketika secara resmi digunakan oleh publik. Oleh karena itu, SLM menggunakan sekitar 5% dari energi yang dikonsumsi melalui pelatihan LLM.

Model-model besar biasanya dijalankan pada komputer awan karena mereka menggunakan lebih banyak daya komputasi daripada yang pernah tersedia pada satu perangkat individu. Hal ini mengakibatkan komplikasi bagi perusahaan karena mereka kehilangan kendali atas informasi mereka saat bergerak ke awan, dan tanggapan yang lambat saat mereka melakukan perjalanan melalui internet.

Menghadapi masa depan, adopsi kecerdasan buatan oleh bisnis tidak akan menjadi satu ukuran cocok untuk semua karena efisiensi dan pemilihan alat terbaik dan paling murah untuk menyelesaikan tugas akan menjadi fokus, yang berarti memilih model yang sesuai untuk setiap proyek.

Ini akan dilakukan untuk semua model, baik itu LLM serbaguna, atau LLM yang lebih kecil dan khusus domain, tergantung pada model mana yang akan memberikan hasil yang lebih baik, membutuhkan lebih sedikit sumber daya, dan mengurangi kebutuhan untuk memigrasi data ke cloud.

Untuk fase berikutnya, kecerdasan buatan akan sangat penting untuk keputusan bisnis karena publik memiliki kepercayaan tinggi pada jawaban yang dihasilkan oleh kecerdasan buatan.

“Ketika Anda memikirkan melatih model AI, mereka harus dibangun di atas dasar data yang hebat.”

~ McMillan

“Itulah yang menjadi tujuan utama kami, menyediakan set data yang dapat dipercaya dan kemudian menyediakan kemampuan dan kemampuan analitik sehingga klien, dan pelanggan mereka, dapat mempercayai hasilnya,” tambah McMillan.

Dengan efisiensi dan ketepatan menjadi permintaan tinggi di dunia, LLM yang lebih kecil dan khusus domain menawarkan pilihan lain untuk menghasilkan hasil yang dapat diandalkan oleh perusahaan dan masyarakat umum.

Panduan Langkah demi Langkah untuk Meluncurkan Karir Web3 Anda dan Mendapatkan Pekerjaan Kripto Berbayar Tinggi dalam 90 Hari.

Lihat Asli
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
Tidak ada komentar