Timnit Gebru menolak menarik kembali makalah AI yang dipecat Google, lima prediksi terbesar tepat setelah lima tahun

GOOGLX-0,44%

谷歌開除Timnit Gebru

Pada bulan Desember 2020, Timnit Gebru (mantan co-lead tim Etika AI Google) saat sedang cuti menerima email yang memberitahunya bahwa ia telah dipecat oleh Google; pemicunya adalah Google meminta agar ia menarik atau menghapus paper dengan pencantuman nama karyawan, namun ia menolak. Paper tersebut mengangkat lima hal—halusinasi dan ketidakpahaman, pembesaran bias, biaya lingkungan, data pelatihan yang tidak dapat diaudit, dan sentralisasi bahasa—yang setelah lima tahun kemudian terbukti memiliki contoh di dunia nyata.

Kecocokan Nyata dari Lima Ramalan: Kasus dan Data yang Terverifikasi

Halusinasi dan ketidakpahaman: Paper ini pada 2021 mendeskripsikan fenomena yang kemudian dikenal sebagai “halusinasi”, yaitu LLM hanya menyusun bentuk-bentuk bahasa berdasarkan probabilitas, “tanpa rujukan apa pun yang memberi makna”. Masalah ini telah menjadi kelemahan yang diketahui dari semua sistem AI arus utama, dan terverifikasi dalam berbagai penilaian akademik independen.

Pembesaran bias: Alat rekrutmen AI Amazon yang dikembangkan sejak 2014 dihentikan pada 2018 karena diskriminasi sistematis terhadap kandidat perempuan; model mempelajari standar penilaian yang bias terhadap laki-laki dari riwayat pelatihan yang didominasi laki-laki. Studi oleh Obermeyer dkk. pada 2019 di jurnal Science mengungkapkan bahwa sebuah algoritma risiko medis yang banyak digunakan menggunakan “biaya perawatan medis” sebagai pengganti “tingkat keparahan penyakit”, sehingga pada skor risiko yang sama, pasien kulit hitam kondisi nyatanya lebih parah; studi tersebut mengonfirmasi bahwa setelah koreksi, proporsi pasien kulit hitam yang ditandai membutuhkan perawatan tambahan akan meningkat dari 17,7% menjadi 46,5%.

Biaya lingkungan: Laporan lingkungan Google 2024 mengungkap bahwa pada 2023 emisi gas rumah kaca mencapai sekitar 14,30 juta ton CO₂e, naik 48% dibanding baseline 2019. Google mengonfirmasi penyebab utamanya adalah lonjakan besar konsumsi listrik pusat data yang didorong oleh AI, yang secara langsung mengancam target netral karbon Google yang ditetapkan untuk 2030.

Data pelatihan tidak dapat diaudit: Pada Desember 2023, Stanford Internet Observatory menemukan 3.226 entri yang diduga berisi konten kekerasan/pelecehan terhadap anak (CSAM) dalam dataset LAION-5B (berisi 5,85 miliar pasangan gambar-teks, yang pernah digunakan untuk melatih Stable Diffusion). Dari jumlah tersebut, 1.008 entri telah dikonfirmasi oleh lembaga eksternal; LAION-5B kemudian diturunkan dari layanan (dihentikan publikasinya).

Sentralisasi bahasa: Studi Thompson dkk. pada 2024 menganalisis korpus data internet berisi 6,38 miliar kalimat dan menemukan 57,1% kalimat termasuk ke dalam kumpulan paralel multibahasa, yang sangat mungkin merupakan konten duplikat berkualitas rendah hasil terjemahan mesin. Selain itu, proporsi ini jauh lebih tinggi pada bahasa ber-sumber daya rendah, yang berarti korpus bahasa ber-sumber daya rendah sedang tercemar oleh produk buruk hasil terjemahan mesin.

Fakta Terverifikasi Pemecatan Gebru dan Latar Belakang Paper

Paper ini memiliki enam penulis; empat di antaranya adalah karyawan Google. Saat Gebru menerima surat pemecatan, ia sedang cuti. Permintaan Google adalah agar nama karyawan ditarik atau dihapus; setelah Gebru menolak, ia diberi tahu selama cuti bahwa keputusan pemecatan telah diambil.

Paper tersebut secara resmi diterbitkan pada Maret 2021. Paper itu secara tegas menyatakan: perusahaan yang membangun LLM secara struktural tidak mungkin membuat “keamanan dan etika” tertinggal dari kecepatan peluncuran produk karena insentif finansial dan persaingan. Peristiwa pemecatan Gebru sendiri telah dikutip secara luas sebagai bukti konkret dari argumen struktural tersebut.

Pertanyaan yang sering diajukan

Apa klaim akademis inti dari paper “Random Parrots”?

Berdasarkan paper itu sendiri, argumen intinya memiliki dua lapisan: lapisan pertama bersifat teknis, yang menunjukkan lima jenis risiko sistemik yang dimiliki LLM: halusinasi, pembesaran bias, biaya lingkungan, data tidak dapat diaudit, dan sentralisasi bahasa. Lapisan kedua lebih mendasar: menjelaskan bahwa kelima jenis risiko ini sulit diselesaikan karena, di bawah persaingan dan tekanan finansial, perusahaan yang membangun LLM secara struktural cenderung menjadikan kecepatan diutamakan dibanding keamanan. Paper tersebut lolos tinjauan sejawat dalam proses peer review di konferensi ACM FAccT.

Bagaimana masalah bias pada alat rekrutmen AI Amazon ditemukan dan ditangani?

Berdasarkan laporan publik, alat rekrutmen AI Amazon mulai dikembangkan pada 2014. Model dilatih menggunakan riwayat lamaran historis yang selama sepuluh tahun terakhir didominasi laki-laki, sehingga secara otomatis mempelajari pola penilaian yang bias terhadap laki-laki. Hal ini menyebabkan lamaran yang memuat kata-kata seperti “women's chess club” secara otomatis dipotong nilainya. Masalah bias ini ditemukan pada 2018; Amazon kemudian menghentikan alat tersebut dan memastikan bahwa alat itu tidak digunakan untuk menilai pelamar nyata.

Kenaikan emisi karbon yang diungkap dalam laporan lingkungan Google 2024, apakah sepenuhnya disebabkan oleh AI?

Berdasarkan laporan lingkungan Google 2024, emisi gas rumah kaca pada 2023 mencapai sekitar 14,30 juta ton CO₂e, naik 48% dibanding baseline 2019. Google secara jelas menyebut penyebab utamanya adalah lonjakan besar konsumsi listrik pusat data yang didorong oleh AI. Penjelasan Google tidak mengklaim kenaikan emisi karbon 100% disebabkan oleh AI, tetapi ekspansi infrastruktur AI telah dikonfirmasi sebagai faktor pendorong utama yang meningkatkan emisi.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar