作者: 林晚晚
Pada tahun 1876, Pameran Dunia Philadelphia. Kaisar Brasil Pedro II mengambil telepon yang ditemukan oleh Bell, dan mendengar suara dari ujung lain, ia terkejut: "Ya Tuhan, ini bisa berbicara!"
Seratus lima puluh tahun kemudian, 18 Maret 2026, Pusat Konferensi San Jose. Di atas panggung GTC, Jensen Huang yang mengenakan jaket kulit hitam juga mengucapkan sesuatu yang mengejutkan.
"Sepuluh tahun lagi, NVIDIA mungkin memiliki sekitar 75.000 karyawan. Mereka akan sangat sibuk, karena harus bekerja bersama 7,5 juta agen AI."
Penonton tertawa.
75.000 orang, 7,5 juta agen, rasio 1:100.
Jensen Huang sendiri juga tertawa, lalu menambahkan: "Mereka akan bekerja sepanjang waktu. Semoga orang-orang kita tidak perlu bersaing dengan mereka."
Tepuk tangan mereda, angka ini tertutup oleh peluncuran chip yang lebih mencolok dan perjanjian kerjasama yang lebih menarik hari itu. Tapi jika kita menarik angka ini sendiri dan memikirkannya sebentar, ini mungkin salah satu kalimat terpenting dari seluruh konferensi.
Bukan hanya Jensen Huang. Tiga bulan sebelumnya, ada orang lain yang menggambarkan masa depan yang sama dengan lebih rinci.
Pada Januari 2026, di CES Las Vegas. CEO McKinsey, Bob Sternfels, menyampaikan angka-angka di atas panggung.
"Kami saat ini memiliki 40.000 karyawan manusia, dan sekitar 25.000 agen AI." Kurang dari dua tahun lalu, angka ini masih beberapa ribu. Dalam enam bulan terakhir, 25.000 agen ini menghasilkan 2,5 juta grafik.
2,5 juta grafik. Dulu pekerjaan ini dilakukan oleh analis baru yang baru masuk. Usia 23-24 tahun, dengan gelar dari universitas ternama, duduk di tengah malam jam 3, menyelaraskan sumbu koordinat.
Itulah titik awal setiap analis McKinsey, menukar kerja mekanis ini dengan tiket menuju jalur menjadi partner.
Sekarang, setengah tiket ini telah diambil alih oleh agen. Sternfels berkata: "AI meningkatkan pertumbuhan beberapa posisi hingga 25%, dan mengurangi posisi lain hingga 25%. Perusahaan terbagi rapi menjadi dua bagian, satu bagian yang berkembang dan satu bagian yang menyusut."
Cerita NVIDIA dan McKinsey berbicara tentang hal yang sama.
Dalam dunia rasio 1:100, yang bekerja adalah agen yang didorong Token, manusia hanyalah antarmuka yang terhubung ke agen tersebut.
Pada minggu GTC itu, Jensen Huang menjadi tamu di All-In Podcast dan mengucapkan sesuatu yang lebih berpengaruh.
"Misalnya kamu punya insinyur dengan gaji tahunan 500.000 dolar. Jika dia tidak menghabiskan setidaknya 250.000 dolar dalam Token, saya akan sangat khawatir."
Pembawa acara bertanya apakah NVIDIA menghabiskan 200 juta dolar untuk membeli Token bagi tim insinyur, Huang menjawab: "Kami sedang berusaha."
Insinyur yang tidak membakar Token, bahkan gaji 50.000 dolar pun tidak sepadan.
Solusi NVIDIA sangat langsung: memasukkan Token ke dalam paket gaji. Huang mengatakan di keynote GTC bahwa di masa depan, setiap insinyur NVIDIA akan memiliki anggaran Token tahunan, sekitar setengah dari gaji pokok mereka.
Seorang insinyur dengan gaji puluhan ribu dolar, akan mendapatkan tambahan kapasitas inferensi setara setengah dari gaji pokok, dan sepertiga dari total paket adalah bahan bakar murni.
Seorang yang menghabiskan anggaran Token penuh, setara memiliki lebih dari sepuluh agen AI yang bekerja 24 jam untuk menulis kode, menjalankan pengujian, mencari literatur, dan melakukan simulasi. Sementara yang hanya menggunakan API gratis, masih mengetik manual. Dua orang dengan CV yang sama, bisa menghasilkan output 5 sampai 10 kali lipat berbeda.
Ini bukan lagi teori di Silicon Valley.
Pada Maret tahun ini, Business Insider melaporkan sebuah perubahan: saat wawancara kerja, insinyur mulai ditanya, "Berapa anggaran Token untuk posisi ini?" Partner di Theory Ventures, Tomasz Tunguz, menyebut anggaran Token sebagai "tiang keempat" dari gaji insinyur, setelah gaji pokok, bonus, dan saham.
Presiden OpenAI, Greg Brockman, lebih langsung: berapa banyak kapasitas inferensi yang bisa kamu panggil, semakin menentukan produktivitas keseluruhanmu.
Huang Huang sendiri dalam pidatonya di GTC mengatakan: "Berapa banyak Token yang mengikuti posisi saya? Ini sudah menjadi alat rekrutmen di Silicon Valley."
Pada tahun 1950-an, gaji pekerja mobil di Detroit termasuk yang tertinggi di seluruh AS. Yang benar-benar membuat mereka hidup kelas menengah adalah jalur perakitan yang ditemukan Henry Ford. Para pekerja berdiri di jalur, mesin bergerak tanpa henti, dan output mereka diperbesar puluhan kali oleh lengan robot. Standar hidup pekerja Detroit jauh melampaui pengrajin manual sebayanya, meskipun keahlian mereka mungkin tidak lebih baik, tetapi mereka berjalan di jalur produksi yang lebih besar.
Anggaran Token tahun 2026 adalah seperti jalur perakitan tahun 1950-an.
Tapi ada satu perbedaan.
Pekerja Detroit bisa pindah dari Ford ke General Motors, ke Chrysler, di mana saja jalur perakitan ada. Serikat pekerja bisa bernegosiasi dengan perusahaan, menuntut kecepatan jalur yang lebih baik dan lingkungan yang lebih aman.
Berbeda dengan anggaran Token. Perusahaan memberi kamu hari itu sebagai pahlawan super, dan hari itu juga kamu kembali menjadi orang biasa. Saham bisa dicairkan, keahlian bisa mengikuti kamu saat pindah kerja. Anggaran Token bukan apa-apa, hanya eksternal, saklar di tangan perusahaan.
Silicon Valley sudah punya istilah baru untuk menggambarkan situasi ini, disebut "GPU kehausan".
Peneliti AI top yang pindah kerja, gaji mereka sudah nomor dua, setelah kekuatan komputasi. Tidak bisa melakukan eksperimen, tidak bisa deploy agen, kemampuan mereka dibatasi kuota. "Berapa Token yang kalian berikan" kadang bahkan lebih penting dari saham. Saham adalah cek yang bisa jatuh nilainya di masa depan, sedangkan anggaran Token adalah produktivitas yang bisa direalisasikan hari ini.
Orang yang tidak menggunakan AI, langsung tersingkir.
Goldman Sachs memperkirakan AI bisa mengotomatisasi 25% pekerjaan di AS. Mercer menyurvei, 65% eksekutif memperkirakan 20-30% karyawan akan dialihkan karena AI. Dua angka ini saling melengkapi: orang yang punya Token akan menghasilkan lebih banyak, yang tanpa Token akan dioptimasi keluar.
Batasnya adalah kuota Token, dan kemampuan manusia, semakin kecil hubungannya.
Nilai individu ditentukan oleh kuota Token. Bagaimana dengan perusahaan?
Pada awal Maret 2026, sebuah perusahaan dari Shanghai bernama MiniMax merilis laporan keuangan tahunan pertamanya sejak IPO. Pendapatan tahun penuh 79 juta dolar, rugi bersih 250 juta dolar. Dari sudut pandang keuangan tradisional, ini perusahaan kecil yang boros uang, pendapatannya hanya sepertiga dari satu kuartal Accenture.
Tapi pasar modal tidak melihatnya begitu.
CEO MiniMax, Yan Junjie, mengatakan sesuatu yang lebih penting dari seluruh laporan keuangan: "Nilai perusahaan ditentukan oleh kepadatan kecerdasan dikalikan throughput Token."
Throughput Token, bukan pertumbuhan pendapatan, bukan jumlah pengguna, bukan margin laba.
Data pendukungnya sangat kuat. Pada Februari 2026, konsumsi Token harian model seri M2 MiniMax meningkat enam kali lipat dibanding dua bulan sebelumnya, Desember. Konsumsi Token dalam skenario pemrograman meningkat sepuluh kali lipat. Di platform penggabungan model AI, OpenRouter, MiniMax menghabiskan 4,55 triliun Token dalam dua minggu, menyingkirkan semua model AS dan menempati posisi teratas dalam daftar konsumsi Token global pertama kalinya.
The South China Morning Post melaporkan bahwa ini menandai berakhirnya dominasi pasar pengembang AS selama setahun oleh model open-source China. Kunci keberhasilannya? Konsumsi Token. Siapa yang membakar Token terbanyak, dialah pemenangnya.
Logika ini juga berlaku untuk OpenAI. Platform API OpenAI memproses 6 miliar Token per menit, meningkat 20 kali dalam dua tahun. Pelanggan perusahaan yang menghabiskan lebih dari 100.000 dolar per tahun, konsumsi Token-nya hampir tujuh kali lipat dalam setahun. Analis Barclays, Ross Sandler, menganalisis data dan menyimpulkan: konsumsi Token di sisi konsumsi OpenAI lebih dari dua kali lipat Google Gemini.
Konsumsi Token menjadi mata uang keras dalam memberi peringkat perusahaan AI.
Lebih menarik lagi, fenomena ini juga terlihat di internal perusahaan. The New York Times melaporkan fenomena bernama "tokenmaxxing": insinyur Meta dan OpenAI bersaing di papan peringkat internal siapa yang menghabiskan Token lebih banyak.
Anggaran Token mulai menjadi fasilitas standar, seperti makan siang gratis dan asuransi gigi sepuluh tahun lalu. Seorang insinyur di kantor Ericsson di Stockholm mengatakan kepada NYT, uang yang dia habiskan untuk Claude mungkin lebih besar dari gajinya, tapi perusahaan yang membayar.
Artikel TechCrunch minggu lalu menghitung: seorang insinyur mungkin menghabiskan 10.000 Token untuk menulis artikel di sore hari, tetapi insinyur yang menjalankan kluster agen bisa membakar jutaan Token dalam sehari tanpa mengetik satu kata pun.
Dua tahun lalu, harga per juta Token adalah 33 dolar. Sekarang, 9 sen. Turun 99,7%. Semakin murah harganya, semakin cepat terbakar. Semakin cepat terbakar, semakin sulit lepas dari ketergantungan.
Yan Junjie memperkirakan: "Di masa depan, permintaan pasar terhadap Token mungkin akan meningkat satu sampai dua kali lipat lipat."
Ini adalah cara baru memberi harga sebuah perusahaan di tahun 2026. Bukan berdasarkan berapa banyak uang yang mereka hasilkan, tetapi berapa banyak Token yang mereka bakar. MiniMax rugi 250 juta dolar, tetapi kurva pertumbuhan throughput Token sangat curam dan investor bersedia bertaruh. Kamu bisa membandingkannya dengan YouTube tahun 2006, yang tidak menghasilkan satu sen pun, tetapi konsumsi bandwidth-nya meningkat secara eksponensial, dan Google bersedia membayar 1,65 miliar dolar untuk membelinya.
Dulu, YouTube membakar bandwidth. Sekarang, MiniMax membakar Token. Satuan pengukurnya berbeda, tetapi logikanya sama.
Pada minggu yang sama di GTC, ada kejadian lain.
Tanggal 18 Maret, Stripe merilis Machine Payments Protocol. Singkatnya: agen AI sekarang bisa membayar sendiri.
Sebuah agen membutuhkan data, membayar sendiri untuk mengunduhnya. Membutuhkan daya komputasi untuk inferensi, membelinya per detik. Membutuhkan API dari agen lain, membayar sendiri. Seluruh proses ini tidak memerlukan konfirmasi manusia. Visa menyesuaikan protokol ini dengan pembayaran kartu kredit, Coinbase membuat dompet khusus agen, dan Mastercard sedang mengembangkan Agent Pay.
Konsumsi Token dari sumber ini bertambah. Sebelumnya hanya ada satu skenario: "manusia mengatur agen." Sekarang, agen sendiri juga mengonsumsi Token, dan uang dari Token itu digunakan untuk membeli lebih banyak Token. Co-founder Stripe, John Collison, menyebutnya sebagai "arus deras."
Huang Huang memberikan angka terkait: NVIDIA akan meningkatkan kecepatan produksi Token dari 22 juta menjadi 700 juta, 350 kali lipat.
Ini seperti membangun jaringan jalan raya, bertaruh bahwa volume lalu lintas akan meningkat secara eksponensial.
Investasi infrastruktur sebesar 600 miliar dolar membutuhkan asumsi utama: konsumsi Token di seluruh dunia harus cukup besar untuk menutup biaya. Asumsi ini masih sebatas hipotesis, dan sangat mahal.
Pada kuartal terakhir 2025, perusahaan teknologi menerbitkan obligasi sebesar rekor 108,7 miliar dolar. Dalam beberapa minggu pertama 2026, lagi-lagi 100 miliar dolar.
Morgan Stanley dan JPMorgan memperkirakan bahwa dalam beberapa tahun ke depan, total utang perusahaan terkait AI bisa mencapai 1,5 triliun dolar. Goldman Sachs memperkirakan, pengeluaran modal AI sudah sekitar 3% dari PDB AS.
Kelompok pertama yang mencium risiko di Wall Street mulai membeli asuransi. Volume swap kredit meningkat. Premi puluhan basis poin dipasang, bertaruh bahwa perusahaan-perusahaan ini mungkin tidak mampu membayar. Kepala strategi kredit Citi, Daniel Sorid, mengatakan dalam sebuah pertemuan investor: "Sebagai investor kredit, menghadapi transformasi sebesar ini, diperlukan investasi modal sebesar ini, yang secara naluriah menimbulkan kekhawatiran."
Pendiri Google, Larry Page, pernah mengatakan sesuatu yang lebih ekstrem di internal perusahaan: "Saya lebih suka bangkrut daripada kalah dalam kompetisi ini."
Ini secara tepat menggambarkan dilema tahanan: setiap raksasa bertaruh lawannya akan terus berinvestasi, sehingga mereka tidak bisa berhenti. Yang berhenti akan langsung keluar.
Dari sisi optimisme, ada data keras. Kecepatan produksi Token meningkat 350 kali lipat. Stripe baru saja membuat agen membayar sendiri. McKinsey dalam dua tahun memperluas dari beberapa ribu agen menjadi 25.000. Jika ekonomi agen benar-benar melesat, kurva pertumbuhan konsumsi Token bisa menjadi eksponensial.
Tapi ada satu tanggal yang membuat banyak orang tidak tenang. Paruh kedua 2026, tebing perpanjangan kontrak.
Dari 2024 sampai 2025, perusahaan menghabiskan "anggaran inovasi." CEO harus mengatakan di laporan keuangan: "Kami sedang mengadopsi AI," harganya tidak terlalu sensitif, hasilnya tidak terlalu ketat, uang yang dikeluarkan hanya untuk menunjukkan sikap. Paruh kedua 2026, proyek percontohan pertama mencapai titik perpanjangan kontrak. Anggaran inovasi habis, CTO menyerahkan posisi di meja, dan CFO duduk di sana. CFO hanya memperhatikan satu angka: ROI.
Jika banyak proyek percobaan dipotong, konsumsi Token di ujung akan tiba-tiba mengalami kekurangan. Kapasitas yang dibangun dari 600 miliar dolar di hulu, data center yang sudah dibangun, listrik yang sudah terpasang, chip yang sudah tersedia, akan menjadi kapasitas menganggur.
Peristiwa ini pernah terjadi dalam sejarah.
Tahun 2000, perusahaan telekomunikasi menghabiskan triliunan dolar membangun kabel serat bawah laut. Setelah gelembung pecah, 90% kabel tersebut tersembunyi di dasar laut, menganggur selama hampir sepuluh tahun. Sampai Netflix mulai streaming dan iPhone memicu internet seluler, kabel-kabel itu akhirnya menyala satu per satu. Kabel tidak sia-sia dipasang. Perusahaan seperti Lucent, Nortel, dan WorldCom bangkrut, tetapi infrastruktur tetap ada, pembangunannya hilang.
Tahun 2012, industri panel surya China. Wuxi Suntech dan Jiangxi Sanyi menembus biaya produksi global. Kapasitas berlebih parah, industri mengalami kerugian selama tiga tahun. Setelah permintaan akhirnya datang, energi surya hari ini adalah energi yang tumbuh tercepat di bumi. Suntech bangkrut. Sanyi bangkrut. Para pelopor tertidur di kegelapan terakhir sebelum fajar.
Setelah Bell menemukan telepon, Western Union menolak membeli paten seharga 100.000 dolar. Sepuluh tahun kemudian, Western Union bersedia membayar 25 juta dolar, tapi Bell tidak mau menjual. Tiga puluh tahun kemudian, jaringan telepon meliputi seluruh Amerika Serikat. Tapi perusahaan kecil yang membangun jaringan itu sebagian besar tidak sempat menyaksikan masa telepon meluas. Pemenangnya adalah AT&T, yang kemudian mengakuisisi dan memonopoli segalanya.
Cerita infrastruktur selalu seperti ini. Arah hampir selalu benar, tetapi perbedaan waktu bisa mematikan.
Kembali ke Token. Struktur yang sebelumnya dijelaskan, Token menjadi tenaga kerja, manusia menjadi antarmuka, kuota Token mendefinisikan segalanya, dan syarat keberhasilannya adalah Token harus terus-menerus, dalam jumlah besar, dan dengan percepatan dikonsumsi. Output 10 kali lipat dari insinyur bergantung pada pasokan Token, jika dipotong, akan kembali nol. Valuasi OpenAI sebesar 8,4 triliun dolar bergantung pada janji daya komputasi, jika protokol dihentikan, nilainya akan menyusut. Infrastruktur sebesar 6 triliun dolar bergantung pada pertumbuhan konsumsi ujung, jika pertumbuhan melambat, akan menjadi idle.
Setiap lapisan bergantung pada lapisan berikutnya. Jika laju konsumsi lebih lambat dua sampai tiga tahun dari laju pembangunan, seluruh rantai harga akan melonggar.
Tahun 2023, jika ada kartu, itu adalah ayah. Tahun 2026, jika ada Token, itu adalah ayah.
Terdengar seperti mengganti satu kata, tetapi perubahan di bawahnya jauh lebih dalam dari yang disadari kebanyakan orang.
GPU adalah aset, jika dibeli, menjadi milikmu, terkunci di server, tidak bisa diambil orang.
Token adalah lalu lintas. Output 10 kali lipatmu, valuasi tinggi, dan posisi tawarmu di meja negosiasi semuanya bergantung pada pasokan yang terus-menerus, yang tidak milikmu. Jika keran ditutup, semuanya kembali ke nol.
Ketika Token benar-benar menjadi tenaga kerja yang bekerja, manusia berubah menjadi antarmuka yang terhubung ke Token. Antarmuka yang baik dapat membuat Token berfungsi lebih besar nilainya, dan kemampuan, estetika, pengalaman, semua masih ada. Tapi seberapa banyak sesuatu bisa dilakukan oleh sebuah antarmuka, pertama-tama tergantung pada berapa banyak Token yang terhubung padanya.
Pada tahun 1870-an, petani Amerika menemukan bahwa menanam gandum yang baik saja tidak cukup, mereka harus menanam di dekat jalur kereta. Pada tahun 1950-an, pengrajin manual menyadari bahwa keahlian mereka tidak bisa mengalahkan pekerja di jalur perakitan. Tahun 2026, insinyur sedang menyadari bahwa menulis kode yang indah pun tidak berarti apa-apa tanpa anggaran Token; semuanya hanya sia-sia.
Ketika Token benar-benar menjadi tenaga kerja yang bekerja, manusia berubah menjadi antarmuka. Kualitas antarmuka masih penting, tetapi nilai antarmuka pertama-tama tergantung pada siapa yang memberi daya padanya.