TEKNOLOGI, Perspektif.co.id — Krisis memori global yang selama ini membayangi industri teknologi kini mendapat tantangan nyata dari laboratorium riset Google. Pada akhir Maret 2026, Google Research resmi memperkenalkan TurboQuant — algoritma kompresi memori AI yang diklaim mampu memangkas konsumsi RAM model kecerdasan buatan berskala besar hingga enam kali lipat tanpa mengorbankan akurasi, dan tanpa memerlukan pelatihan ulang. Pengumuman itu, sebagaimana dilaporkan TechCrunch dan VentureBeat, langsung mengguncang pasar saham global dan memicu debat panjang di kalangan ilmuwan komputer, investor, hingga para penggemar PC rakitan — termasuk di Indonesia, di mana harga kit DDR5 32GB sempat melampaui Rp7 juta dalam beberapa bulan terakhir.
Bersama TurboQuant, Google turut mempresentasikan dua metode pendukung: Quantized Johnson-Lindenstrauss (QJL) dan PolarQuant — keduanya akan dipresentasikan secara resmi di konferensi ICLR 2026. Inti masalah yang coba dipecahkan adalah KV Cache, semacam “memori kerja jangka pendek” yang digunakan model bahasa besar seperti Gemini, ChatGPT, dan Claude saat aktif merespons pertanyaan. Metode kompresi ini memanfaatkan vector quantization untuk membersihkan kemacetan cache dalam pemrosesan AI, sehingga AI dapat menyimpan lebih banyak informasi dalam ruang yang lebih kecil sembari tetap menjaga akurasi, menurut para peneliti Google.
Berdasarkan hasil pengujian yang dilaporkan TechRadar, TurboQuant berhasil mengurangi penggunaan memori key-value cache sebesar enam kali lipat sambil mempertahankan konsistensi hasil. Algoritma ini memungkinkan quantization hingga tiga bit saja tanpa memerlukan pelatihan ulang, mengisyaratkan kompatibilitasnya dengan arsitektur model yang sudah ada. Pada GPU NVIDIA H100, implementasi 4-bit TurboQuant mencapai percepatan komputasi attention logits hingga delapan kali lebih cepat dibandingkan operasi 32-bit standar.
Reaksi pasar datang cepat. Cloudflare CEO Matthew Prince menyebut TurboQuant sebagai “momen DeepSeek milik Google” di platform X, sebagaimana dikutip TechCrunch. Harga DDR5 32GB mengalami penurunan pertama yang berarti dalam beberapa bulan — turun sekitar 40 hingga 100 dolar AS atau sekitar Rp660.000 hingga Rp1,65 juta di beberapa peritel besar — memicu spekulasi bahwa pusat data AI akan segera membutuhkan lebih sedikit memori. Saham para pemasok memori besar termasuk Micron dan Western Digital langsung tertekan, mencerminkan kekhawatiran investor bahwa permintaan High Bandwidth Memory yang selama ini tak terpuaskan bisa dimoderasi oleh efisiensi algoritmik.
Namun para analis meminta publik tidak terlalu optimistis. Ben Barringer dari Quilter Cheviot yang dikutip CNBC menyebut TurboQuant sebagai sesuatu yang “evolusioner, bukan revolusioner” — algoritmanya hanya menyentuh proses inferensi, bukan pelatihan, sehingga tidak secara langsung memangkas total permintaan chip DRAM. TrendForce bahkan memproyeksikan harga kontrak DRAM standar masih akan naik 55 hingga 60 persen secara kuartal ke kuartal sepanjang 2026, karena kesenjangan pasokan dan permintaan terus melebar.
Google belum merilis kode resmi, dan TurboQuant masih berstatus riset. Meski demikian, para pengembang independen telah membangun implementasi awal untuk PyTorch, MLX milik Apple, dan llama.cpp. Rilis resmi Google diperkirakan tiba sekitar pertengahan 2026. Bagi pasar Indonesia yang selama ini terdampak lonjakan harga DDR5 akibat tekanan AI global, TurboQuant hadir sebagai sinyal harapan — namun bukan jaminan penurunan harga dalam waktu dekat.