Mengapa Pusat Data AI Tidak Dapat Hanya Mengandalkan GPU? Menelusuri Sinergi antara Memori, Jaringan, dan Penyimpanan

Pasar
Diperbarui: 30/06/2026 04:57

Pada Juni 2026, Bitcoin bergerak di kisaran US$60.000 sementara Ethereum diperdagangkan di level sekitar US$1.600, menandakan periode konsolidasi di pasar kripto. Sebaliknya, sektor lain—yakni infrastruktur pusat data AI—mengalami lonjakan aktivitas. Gartner memproyeksikan belanja TI global akan mencapai US$6,31 triliun pada 2026, meningkat 13,5% secara tahunan, dengan belanja sistem pusat data memimpin seluruh kategori dengan tingkat pertumbuhan 55,8%. IDC memperkirakan belanja AI perusahaan secara global akan menembus US$940 miliar pada 2026.

Di tengah "perlombaan senjata" komputasi ini, terjadi pergeseran perspektif yang krusial: daya saing pusat data AI kini tidak lagi ditentukan semata-mata oleh jumlah GPU atau puncak daya komputasi. Fokusnya kini beralih pada sinergi menyeluruh antara komputasi, penyimpanan, dan jaringan dalam satu klaster. Memahami bagaimana Memory, Networking, dan Storage bekerja sama menjadi kunci dalam menilai nilai investasi infrastruktur AI.

Dinding Memori: Hambatan Pertama di Era Model Besar

Ukuran parameter model besar AI telah tumbuh secara eksponensial dalam dua tahun terakhir. Dari 2024 hingga 2026, parameter model utama meningkat seratus kali lipat, dan context window berkembang dari puluhan ribu menjadi jutaan token. Namun, bandwidth memori server tumbuh kurang dari 15% per tahun, jauh tertinggal dari laju permintaan bisnis AI. Ketimpangan tajam antara laju iterasi perangkat lunak dan perangkat keras ini menjadikan "dinding memori" sebagai hambatan inti yang membatasi daya komputasi AI.

Dinding memori mengacu pada kenyataan bahwa kecepatan pemrosesan CPU/GPU meningkat jauh lebih cepat daripada bandwidth dan latensi baca/tulis memori. Sementara chip komputasi beroperasi sangat cepat, data tidak dapat disuplai dengan cukup cepat, menyebabkan prosesor banyak menganggur menunggu data. Menurut laporan pengujian industri, di klaster GPU berskala besar, hambatan I/O data dapat menyebabkan GPU menganggur lebih dari 40% waktu—artinya hampir separuh chip mahal ini hanya menunggu transfer data.

Sumber daya memori kini menjadi sangat langka. Satu server inferensi AI mengonsumsi lebih dari sepuluh kali lipat DRAM dan HBM dibanding server pusat data tradisional, dengan hampir 60% kapasitas wafer DRAM global kini dialokasikan untuk klaster AI. HBM, khususnya, mengalami kekurangan pasokan kronis, dengan kapasitas produksi utama telah dipesan pelanggan besar hingga 2026 bahkan 2027. Gartner mencatat lonjakan permintaan dan keterbatasan pasokan telah mendorong harga HBM ke rekor tertinggi, menjadikan memori sebagai segmen bernilai tambah tinggi bagi produsen semikonduktor.

Untuk menembus dinding memori, industri bergerak di dua jalur: Pertama, optimasi perangkat lunak seperti fine-tuning dan kompresi, misalnya penjadwalan tiered KV cache serta kuantisasi bit rendah, untuk memaksimalkan sumber daya penyimpanan yang ada. Kedua, inovasi arsitektur perangkat keras, termasuk peningkatan HBM dan adopsi protokol interkoneksi memori baru seperti CXL (Compute Express Link). Platform HGX Rubin generasi terbaru dari NVIDIA telah melipatgandakan bandwidth memori GPU menjadi 176 TB/s. Kedua pendekatan ini bukan saling meniadakan, melainkan strategi saling melengkapi yang membentuk ulang logika kolaborasi storage dan compute di seluruh industri.

Jaringan: "Jaringan Syaraf" Klaster AI

Jika memori menangani efisiensi transfer data dalam satu node, maka jaringan menyelesaikan tantangan perpindahan data antar node. Dalam klaster AI berskala besar, ratusan hingga ribuan GPU harus bekerja sama untuk melatih atau melakukan inferensi satu model, sehingga efisiensi komunikasi antar GPU sangat menentukan kecepatan pelatihan secara keseluruhan.

Saat ini, hambatan bandwidth terjadi di berbagai level: Antar chip, interkoneksi PCB tradisional sudah tidak lagi memadai untuk kebutuhan bandwidth tinggi dan latensi rendah chip AI. Di dalam rak server, bandwidth antar server membatasi skalabilitas vertikal. Antar pusat data, bandwidth transmisi jarak jauh dan latensi membatasi skalabilitas horizontal dan penjadwalan beban kerja lintas wilayah. Estimasi menunjukkan bahwa, di klaster pelatihan AI saat ini, konsumsi energi untuk perpindahan data kini melampaui konsumsi untuk komputasi itu sendiri.

NVLink dan InfiniBand dari NVIDIA telah lama mendominasi pasar interkoneksi internal klaster AI. NVLink Switch terbaru kini menawarkan bandwidth 28,8 TB/s, dua kali lipat generasi sebelumnya. Namun, lanskap ini mulai berubah—perusahaan seperti AMD dan Broadcom mengembangkan solusi interkoneksi mereka sendiri, dan standar terbuka seperti UALink (Ultra Accelerator Link) berkembang pesat. Pada 2026, persaingan jaringan akan bergeser dari "hanya NVIDIA" menjadi "multi-standar", sehingga kemampuan integrasi sistem menjadi tolok ukur baru bagi operator pusat data.

Penyimpanan: Dari "Gudang" Menjadi "Pipa Data"

Di pusat data tradisional, penyimpanan berfungsi sebagai "gudang data"—utama untuk mengarsipkan dan menjaga data dingin. Namun di pusat data AI, penyimpanan berevolusi menjadi "pipa data"—bertugas mengalirkan data pelatihan ke node komputasi dengan kecepatan sangat tinggi dan mendukung pembacaan parameter model berlatensi rendah saat inferensi.

Pelatihan AI memerlukan akses cepat ke volume data mentah yang sangat besar, sementara inferensi menuntut pengambilan bobot model dan KV cache secara kilat. KV cache kini diperluas dari HBM GPU ke DRAM sistem, bahkan hingga SSD lokal berkecepatan tinggi. Hal ini mengaburkan batas antara storage dan memori, menjadikan perangkat penyimpanan bukan sekadar endpoint data, melainkan node penting dalam alur data.

All-flash storage menggantikan hard disk tradisional sebagai pilihan utama pusat data AI. Pada ISC High Performance 2026, Sugon memamerkan produk all-flash storage dan jaringan kecepatan tinggi native, menegaskan tren industri ini. Performa storage kini secara langsung menentukan apakah data dapat sampai ke unit komputasi tepat waktu, sehingga berdampak pada tingkat utilisasi GPU.

Sinergi Compute-Memory-Network: Dari Terobosan Titik Tunggal ke Optimasi Sistem

Setelah peran dan hambatan tiap komponen jelas, makna "sinergi" menjadi nyata: Daya komputasi riil pusat data AI bukanlah penjumlahan sederhana dari performa GPU, bandwidth memori, throughput jaringan, dan IOPS storage. Sebaliknya, output efektif dihasilkan dari keterpaduan sistemik keempat elemen tersebut.

Pertumbuhan parameter model yang pesat mendorong lahirnya superklaster AI. Kegunaan kini tidak lagi hanya ditentukan performa chip, melainkan semakin oleh sinergi dan efisiensi compute, storage, serta networking dalam satu klaster. Pandangan ini cepat menjadi konsensus industri.

Secara praktik, desain compute-memory-network terintegrasi erat telah menjadi standar di kalangan vendor terdepan. Superklaster AI scaleX milik Sugon mengusung filosofi integrasi penuh ini, sehingga secara signifikan meningkatkan efisiensi pelatihan dan inferensi. Sistem operasi inferensi Dynamo 1.0 NVIDIA, dipadukan dengan platform BlueField-4 CMX, menghubungkan GPU, HBM, DRAM host, flash lokal, dan storage remote lintas beberapa lapisan secara mulus, memecah silo memori GPU dengan pengaturan otomatis hot dan cold data.

Laporan IDC Juni 2026 menegaskan: Keunggulan kompetitif AI kini bukan lagi soal compute terkuat, melainkan bagaimana mengubah AI menjadi kapabilitas bisnis berkelanjutan dengan biaya token terendah. Di inti biaya token adalah efisiensi gabungan compute, memory, networking, dan storage.

Lanskap Pasar: Siapa yang Diuntungkan?

Tren industri ini sudah tercermin jelas di pasar modal.

Di sisi memori, SK Hynix tampil sebagai bintang 2026. Pada 22 Juni 2026, saham SK Hynix melonjak 6% ke rekor 2.944.000 KRW, melampaui Samsung dan menjadi perusahaan publik paling bernilai di Korea, dengan kenaikan lebih dari 349% sejak awal tahun. Micron juga mencatat kinerja kuat, dengan pendapatan kuartalan lebih dari empat kali lipat pada pekan terakhir Juni dan 16 kontrak pasokan jangka panjang baru diumumkan. Harga saham Micron melonjak 16% pada hari pengumuman laporan keuangannya.

Di bidang jaringan, pemasok serat optik Corning mencetak rekor tertinggi pada pekan terakhir Juni, seiring peran penting produknya di pusat data AI kembali diapresiasi pasar. Pesanan infrastruktur AI Cisco telah melampaui US$9 miliar.

Di server dan integrasi sistem, pendapatan server Dell yang dioptimalkan AI mencapai US$16,1 miliar dalam satu kuartal, naik 757% secara tahunan. Supermicro menguasai sekitar 70% pangsa pasar teknologi pendingin cair langsung.

Untuk operasi pusat data, BOCOM International menobatkan GDS (GDS-SW) dan SUNeVision (SUNEVISION) sebagai pilihan utama di sektor pusat data, dengan alasan lonjakan permintaan akibat AI generatif. UBS juga mencatat industri pusat data internet Tiongkok akan mempercepat pertumbuhan signifikan mulai paruh kedua 2026.

Bagaimana Berinvestasi di Infrastruktur AI lewat Gate?

Gate kini menyediakan akses ke lebih dari 12.500 saham dan ETF di pasar AS, Hong Kong, dan Korea. Investor dapat menggunakan satu akun terintegrasi untuk memperdagangkan saham global langsung dengan USDT dan aset digital lain, sehingga alokasi antara kripto dan sekuritas tradisional menjadi mulus.

Di sektor infrastruktur pusat data AI, Gate mencakup seluruh rantai industri, mulai dari chip hingga aplikasi:

Untuk saham AS, investor dapat memperdagangkan perusahaan inti seperti NVIDIA (NVDA), AMD, Micron (MU), Broadcom (AVGO), Dell (DELL), Supermicro (SMCI), Corning (GLW), dan Cisco (CSCO). Gate mendukung perdagangan pre-market dan after-hours, memperluas jam perdagangan menjadi 16×5, memungkinkan pengguna merespons rilis laporan keuangan dan data makro secara cepat.

Untuk saham Hong Kong, investor dapat fokus pada operator pusat data seperti GDS (09698.HK) dan SUNeVision (01686.HK).

Untuk saham Korea, SK Hynix (000660.KS) adalah pemimpin tak terbantahkan di HBM, sementara Jeju Semiconductor berperan penting di hulu material komunikasi optik pusat data AI.

Perdagangan saham di Gate menawarkan biaya serendah 0,1%, mendukung mode perdagangan leverage maupun spot, dan pengguna dengan kepemilikan US$2.000 atau lebih menikmati tarif VIP eksklusif. Bagi investor yang mencari eksposur sistematis ke sektor infrastruktur pusat data AI, kemampuan perdagangan lintas pasar, multi-aset, dan satu pintu dari Gate menurunkan hambatan alokasi aset teknologi global.

Kesimpulan

Pusat data AI bergerak dari era "menumpuk GPU" menuju fase baru optimasi tingkat sistem. Memori, jaringan, dan storage kini bukan lagi komponen infrastruktur terpisah—melainkan variabel sistem yang, dalam kerangka sinergi compute-memory-network, bersama-sama menentukan output riil daya komputasi AI.

Memahami logika ini tidak hanya membantu menilai tren teknologi, tetapi juga menyediakan kerangka analisis yang kokoh untuk keputusan investasi. Dari chip hingga memori, jaringan hingga storage, server hingga operasi pusat data, seluruh rantai industri baru mulai dinilai ulang. Ketika volatilitas pasar kripto jangka pendek bersinggungan dengan narasi jangka panjang infrastruktur AI, terbuka jendela baru untuk alokasi aset antara ekonomi digital dan riil.

FAQ

Q1: Mengapa pusat data AI tidak bisa menyelesaikan isu daya komputasi hanya dengan menambah GPU?

GPU hanyalah titik akhir output komputasi. Performa GPU sangat bergantung pada apakah bandwidth memori mampu memasok data tepat waktu, apakah jaringan dapat mengoordinasikan paralelisme multi-GPU secara efisien, dan apakah storage mampu menangani pembacaan dan penulisan data masif dengan cepat. Di klaster GPU besar, hambatan I/O data dapat menyebabkan GPU menganggur lebih dari 40% waktu—sekadar menambah GPU tanpa mengatasi tiga area ini justru membuang-buang daya komputasi.

Q2: Mengapa HBM sangat langka?

HBM (High Bandwidth Memory) adalah standar memori untuk chip AI, dengan proses manufaktur kompleks dan siklus ekspansi lebih dari dua tahun. Pada 2026, permintaan inferensi AI akan melampaui pelatihan, semakin mendorong kebutuhan HBM dan DRAM berkapasitas besar. Sebagian besar kapasitas produksi sudah dipesan pelanggan utama hingga 2026 bahkan 2027, sehingga pasokan jangka pendek sangat terbatas.

Q3: Apa logika inti investasi di infrastruktur pusat data AI?

Logika intinya adalah pergeseran dari "didominasi pelatihan" ke "ledakan permintaan full-stack". Pada 2026, Microsoft, Google, Amazon, dan Meta secara kolektif akan menggelontorkan US$725 miliar untuk belanja modal infrastruktur AI. Skala investasi sebesar ini tidak bisa ditanggung satu segmen saja; seluruh rantai nilai—dari chip dan memori hingga jaringan dan operasi pusat data—akan diuntungkan secara struktural.

Q4: Bagaimana Gate memfasilitasi perdagangan saham terkait pusat data AI?

Gate menyediakan akses ke lebih dari 12.500 saham dan ETF AS, Hong Kong, dan Korea. Pengguna dapat deposit dengan USDT dan aset digital lain, serta memperdagangkan saham infrastruktur AI utama seperti NVIDIA, Micron, dan SK Hynix dalam satu akun terintegrasi. Gate mendukung perdagangan pre-market dan after-hours, mode leverage maupun spot, dengan biaya serendah 0,1%.

Q5: Apa risiko utama investasi di infrastruktur pusat data AI?

Risiko utama meliputi: (1) Ketidaksesuaian permintaan dan pasokan dapat menyebabkan kelebihan pasokan sementara—BOCOM International menyoroti perlunya mewaspadai siklus mismatch dan fluktuasi valuasi; (2) Keberlanjutan belanja modal penyedia cloud hyperscale—J.P. Morgan memperingatkan pertumbuhan capex 2025–2026 jauh melampaui pertumbuhan pendapatan, menekan arus kas; (3) Ketegangan geopolitik dan kontrol ekspor dapat mengganggu rantai pasok chip canggih.

The content herein does not constitute any offer, solicitation, or recommendation. You should always seek independent professional advice before making any investment decisions. Please note that Gate may restrict or prohibit the use of all or a portion of the Services from Restricted Locations. For more information, please read the User Agreement
Like Konten