27 April 2026, 16:49

Google Rilis TPU Generasi 8 Dua Varian Sekaligus dan Platform Agen AI Enterprise, Tantang Dominasi Nvidia

Google Cloud luncurkan TPU 8t & 8i generasi ke-8 di Cloud Next 2026, plus Gemini Enterprise Agent Platform untuk agen AI enterprise. Performa 3x lebih cepat!

Reporter: Hasida Kuchiki
Editor: Deden M Rojani
111
Google Rilis TPU Generasi 8 Dua Varian Sekaligus dan Platform Agen AI Enterprise, Tantang Dominasi Nvidia
Google Cloud resmi luncurkan TPU 8t & 8i generasi ke-8 dan Gemini Enterprise Agent Platform di Cloud Next 2026, Las Vegas, untuk era AI agentic. (Foto: Google Cloud)

TEKNOLOGI, Perspektif.co.id — Google Cloud secara resmi memperkenalkan chip akselerator AI generasi kedelapan dalam dua varian sekaligus—TPU 8t dan TPU 8i—pada ajang Google Cloud Next 2026 yang digelar di Las Vegas, Amerika Serikat, Rabu (22/4/2026). Langkah ini menandai babak baru dalam strategi infrastruktur AI Google, sekaligus merupakan tantangan terbuka terhadap dominasi Nvidia di pasar chip kecerdasan buatan global. Bersamaan dengan peluncuran chip tersebut, Google juga memperkenalkan Gemini Enterprise Agent Platform, ekosistem terpadu yang dirancang untuk memungkinkan perusahaan membangun, mengelola, dan mengoptimalkan ribuan agen AI otonom secara bersamaan.

Untuk pertama kalinya dalam sejarah lini produk TPU-nya, Google memisahkan chip unggulannya menjadi dua arsitektur yang benar-benar berbeda: TPU 8t yang dioptimalkan untuk pelatihan model skala besar, dan TPU 8i yang difokuskan pada beban kerja inferensi. Keputusan ini mencerminkan pergeseran mendasar dalam cara Google memandang era AI agentic—di mana AI tidak hanya menjawab pertanyaan, tetapi juga merencanakan dan mengeksekusi tugas-tugas kompleks secara mandiri tanpa intervensi manusia. Google menegaskan bahwa kepemimpinan di era agentic tidak bisa lagi mengandalkan perangkat keras serba guna, sehingga dua arsitektur yang dibangun khusus ini menjadi fondasi untuk generasi berikutnya.

TPU 8t dirancang untuk skala masif dalam pelatihan model: satu superpod mampu mengintegrasikan hingga 9.600 chip sekaligus dengan 2 petabyte memori high-bandwidth yang dibagi bersama, mencapai tiga kali lipat kemampuan komputasi dibandingkan generasi Ironwood sebelumnya, sekaligus memberikan efisiensi dua kali lebih tinggi dalam hal performa per watt. Angka ini bukan sekadar peningkatan inkremental—menurut Google, siklus pengembangan model frontier yang sebelumnya memakan waktu berbulan-bulan kini dapat dipangkas menjadi beberapa minggu saja, sebagaimana dilaporkan CGTN dalam liputannya atas acara tersebut.

Di sisi lain, TPU 8i yang dikhususkan untuk inferensi hadir dengan 288 GB memori high-bandwidth yang dipasangkan bersama 384 MB SRAM on-chip—tiga kali lebih besar dibandingkan generasi sebelumnya—yang memungkinkan model aktif berjalan sepenuhnya di dalam chip tanpa hambatan akses memori eksternal. Chip ini juga menghadirkan latensi jaringan 50% lebih rendah dan mampu menghubungkan 1.152 TPU dalam satu pod tunggal, sehingga cocok digunakan untuk menjalankan jutaan agen AI secara bersamaan dengan biaya yang jauh lebih efisien. TechCrunch mencatat bahwa secara keseluruhan, lini TPU 8 ini menawarkan peningkatan performa per dolar sebesar 80% dibandingkan generasi Ironwood, serta kemampuan menghubungkan lebih dari satu juta chip dalam satu klaster logis tunggal.

Berbeda dari kebiasaan Google sebelumnya yang hanya membuat varian dari satu desain dasar, TPU 8t dirancang bersama Broadcom sedangkan TPU 8i dikembangkan bersama MediaTek—masing-masing benar-benar dibangun dari nol untuk kebutuhan spesifiknya, bukan sekadar turunan dari satu platform yang sama. Keduanya berjalan di atas CPU Axion berbasis ARM buatan Google sendiri dan mendukung framework populer seperti JAX, PyTorch, SGLang, serta vLLM secara langsung, dengan akses bare metal tersedia bagi pelanggan yang membutuhkan kontrol penuh atas infrastruktur mereka.

“Agentic computing akan mendefinisikan ulang apa yang mungkin dilakukan. Kami sangat antusias mengumumkan inkarnasi terbaru dari inovasi tanpa henti kami untuk mendorong transformasi ini, TPU 8i dan 8t,” tulis Matt Renner dan Matt A.V. Chaban dari Google Cloud dalam blog resmi perusahaan yang dipublikasikan pada 22 April 2026.

Di luar infrastruktur chip, Google juga memperluas ekosistem enterprise-nya secara signifikan melalui peluncuran Gemini Enterprise Agent Platform. Platform baru ini merupakan evolusi langsung dari Vertex AI, menggabungkan layanan pembangunan dan penyempurnaan model dengan fitur-fitur baru untuk integrasi agen, keamanan, DevOps, dan orkestrasi dalam satu atap—dirancang sebagai pusat kendali tunggal untuk semua kebutuhan agen otonom perusahaan. Melalui Model Garden, platform ini memberikan akses ke lebih dari 200 model AI terdepan di dunia, mencakup model first-party terbaru Google seperti Gemini 3.1 Pro, Gemini 3.1 Flash Image, dan Lyria 3, sekaligus mendukung model pihak ketiga termasuk Claude Opus, Sonnet, dan Haiku dari Anthropic.

“Platform ini menyediakan jaringan penghubung full-stack yang aman untuk membangun, menskalakan, mengatur, dan mengoptimalkan agen Anda dengan percaya diri—sebuah mission control untuk enterprise di era agentic,” ujar CEO Google Sundar Pichai dalam keynote Google Cloud Next 2026, sebagaimana dikutip dari blog resmi Google.

Momentum Gemini Enterprise terbukti kuat: pada kuartal pertama 2026, Google mencatat pertumbuhan pengguna aktif berbayar bulanan sebesar 40% secara kuartal ke kuartal, dengan pelanggan besar yang sudah mengadopsi platform ini antara lain Bosch, Capcom, GE Appliances, NASA, PepsiCo, dan Unilever. Sebagai bagian dari ekspansi ini, Google juga memperkenalkan Agentic Data Cloud, arsitektur berbasis AI yang memungkinkan agen untuk mempersepsi, bernalar, dan bertindak atas data bisnis secara real-time—menjembatani kesenjangan antara kemampuan berpikir AI dan tindakan nyata dalam sistem produksi perusahaan.

Dalam paket lengkap yang diumumkan di Cloud Next 2026, Google turut memperkenalkan Agentic Defense—platform keamanan siber berbasis AI yang mengombinasikan kemampuan Google Threat Intelligence dan Security Operations dengan platform Cloud dan AI Security milik Wiz—untuk melindungi infrastruktur perusahaan dari ancaman yang semakin kompleks di era agen otonom. Seluruh inovasi ini, mulai dari chip TPU generasi delapan hingga Gemini Enterprise Agent Platform dan Agentic Defense, menunjukkan ambisi Google Cloud untuk tidak sekadar bersaing di pasar cloud enterprise, tetapi menjadi penyedia infrastruktur AI paling komprehensif bagi bisnis yang ingin beralih dari eksperimen AI ke penerapan produksi skala penuh—dengan target ketersediaan umum TPU 8t dan 8i dijadwalkan pada paruh kedua tahun 2026.

Berita Terkait