Hugging Face Open-Sources ml-intern, Agen AI untuk Riset ML Otonom

Pesan Gate News, 22 April — Hugging Face telah merilis ml-intern secara open-source, sebuah agen riset ML yang mampu menyelesaikan sepenuhnya alur kerja membaca paper, mengorganisasi kumpulan data, menjalankan pelatihan GPU, mengevaluasi hasil, dan mengiterasi perbaikan secara otonom. Proyek ini dibangun di atas framework smolagents milik Hugging Face dan menyediakan antarmuka CLI maupun berbasis web, dengan kode yang tersedia di GitHub.

Toolchain ml-intern dirancang berpusat pada ekosistem Hugging Face. Ia mengambil paper dari arXiv dan HF Papers sambil menelusuri rantai sitasi untuk bacaan yang lebih mendalam; menjelajahi kumpulan data di HF Hub, memvalidasi kualitas, dan memformat ulang data untuk pelatihan; dan saat sumber daya GPU lokal tidak tersedia, ia memanggil HF Jobs untuk menjalankan tugas pelatihan berbasis cloud. Setelah pelatihan selesai, agen secara otomatis membaca output evaluasi, mendiagnosis penyebab kegagalan, dan menjalankan ulang eksperimen. Secara default, ia menggunakan Claude Sonnet 4.5 untuk menggerakkan loop keputusan, dengan maksimum 300 iterasi per sesi dan pemampatan konteks otomatis saat melebihi 170k token.

Hugging Face menunjukkan tiga kasus penggunaan. Dalam tugas penalaran ilmiah, agen mengidentifikasi dataset OpenScience dan NemoTron-CrossThink dari rantai sitasi, menyaring tujuh varian dari ARC, SciQ, dan MMLU berdasarkan tingkat kesulitan, dan menjalankan 12 putaran supervised fine-tuning pada Qwen3-1.7B, meningkatkan skor GPQA dari 10% menjadi 32% dalam waktu kurang dari 10 jam. Untuk aplikasi medis, agen menyimpulkan bahwa dataset yang ada tidak mencukupi, menulis skrip untuk menghasilkan 1.100 sampel data sintetis, dan menskalakannya 50 kali lipat untuk pelatihan, melampaui performa Codex sebesar 60% pada HealthBench. Dalam skenario kompetisi matematika, agen menulis skrip pelatihan GRPO dan meluncurkan pelatihan pada GPU A100 melalui HF Spaces, lalu melakukan studi ablation setelah mengamati runtuhnya reward.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Peluncuran Aethir Claw V1: Terapkan Agen AI Tanpa Kode dalam Kurang dari Lima Menit

Pesan Gate News, 22 April — Aethir, penyedia infrastruktur cloud GPU terdesentralisasi, meluncurkan versi 1.0 dari Aethir Claw, platform hosting agen AI-nya, hari ini. Platform ini memungkinkan pengguna tanpa latar belakang teknis untuk menerapkan dan mengonfigurasi agen AI sepenuhnya di dalam browser mereka dalam waktu kurang dari lima

GateNews12menit yang lalu

Google Meluncurkan Alat Agen AI untuk Membantu Perusahaan Mengautomasi Tugas

Google mengungkapkan alat untuk membangun agen AI guna mengautomasi tugas, melacak kemajuan, dan mengelola alur kerja melalui kotak masuk agen khusus, dengan pembaruan Workspace dan visi bahwa agen AI akan mengubah rutinitas kerja sehari-hari karyawan. Abstrak: Google meluncurkan alat untuk membuat agen AI bagi otomasi tugas, memantau perkembangannya, dan menyederhanakan alur kerja, menandai pembaruan Workspace dan masa depan di mana agen AI mengubah pekerjaan harian.

GateNews1jam yang lalu

Microsoft Meluncurkan Infrastruktur Komersial Agen AI: Marketplace Penerbit, Protokol Pedagang, dan Alat Iklan

Gate News message, April 22 — wakil presiden monetisasi AI Microsoft, Tim Frank, mengumumkan rangkaian pembaruan infrastruktur komersial yang ditujukan untuk era "agentic web", yang memungkinkan penerbit, pedagang, dan pengiklan tetap dapat ditemukan dan dapat diperdagangkan saat agen AI membuat keputusan pembelian atas nama pengguna di

GateNews3jam yang lalu

NeoCognition Mengumpulkan $40M dalam Pendanaan Seed untuk Agen AI Pembelajaran On-the-Job

Pesan Gate News, 22 April — Lab riset AI NeoCognition mengumumkan penyelesaian putaran seed sebesar $40 juta, muncul dari mode penyamaran. Didirikan oleh Profesor Associate Universitas Negeri Ohio Yu Su, bersama dengan Xiang Deng dan Yu Gu, perusahaan ini berkantor pusat di Palo Alto, California. Putaran tersebut w

GateNews4jam yang lalu

PicWe Meluncurkan Dompet Agen AI dengan Manajemen Kunci di Perangkat

PicWe mengumumkan beta publik PicWe Wallet, dompet kunci berbasis agen AI yang berjalan di perangkat (on-device) dengan tanpa frasa pemulihan. Dompet ini mendukung aset multi-chain, pertukaran (swap), otomasi yang dapat diakses oleh AI, serta bertujuan untuk menyatukan infrastruktur RWA. PicWe telah meluncurkan beta publik PicWe Wallet, dompet berbasis Agen AI yang menyimpan kunci di perangkat, menghilangkan frasa pemulihan, dan menjaga operasi penting tetap lokal. Beta ini mendukung manajemen aset multi-chain, swap, dan pembayaran biaya berbasis stablecoin sambil memungkinkan interaksi AI yang dapat diprogram. Inisiatif PicWe yang lebih luas memposisikan platform sebagai infrastruktur terpadu untuk aset dunia nyata, memungkinkan penerbitan, peredaran, penyelesaian (settlement), pembayaran lintas batas, tokenisasi, dan koordinasi rantai pasok untuk kasus penggunaan perusahaan.

GateNews4jam yang lalu

Google Research Merilis ReasoningBank: Agen AI Belajar Strategi Penalaran dari Keberhasilan dan Kegagalan

Berita Gate, 22 April — Google Research merilis ReasoningBank, sebuah kerangka memori agen yang memungkinkan agen yang digerakkan oleh model bahasa besar untuk terus belajar setelah penerapan. Kerangka ini mengekstrak strategi penalaran universal dari pengalaman tugas yang berhasil maupun yang gagal, menyimpannya

GateNews5jam yang lalu
Komentar
0/400
Tidak ada komentar