18 May 2026, 15:47

Zyphra Pecahkan Rekor Kecepatan AI: Model Difusi MoE Pertama di Dunia Capai 7,7x Lebih Cepat dari Autoregressive

Zyphra rilis ZAYA1-8B-Diffusion-Preview, model difusi MoE pertama dunia dengan kecepatan inferensi 7,7x lebih cepat dari model autoregresif berbasis AMD.

Reporter: Hasida Kuchiki

Editor: Deden M Rojani

Zyphra Pecahkan Rekor Kecepatan AI: Model Difusi MoE Pertama di Dunia Capai 7,7x Lebih Cepat dari Autoregressive — Diagram arsitektur ZAYA1-8B Diffusion Preview — model difusi MoE pertama Zyphra yang mampu menghasilkan inferensi 7,7x lebih cepat dibanding model autoregresif konvensional. (Foto: Zyphra)

TEKNOLOGI, Perspektif.co.id — Startup AI asal San Francisco, Zyphra, mengguncang industri kecerdasan buatan dengan merilis ZAYA1-8B-Diffusion-Preview — model difusi bahasa berbasis Mixture of Experts (MoE) pertama yang dikonversi dari model autoregresif, sekaligus model difusi bahasa pertama yang dilatih di atas perangkat keras AMD. Pengumuman ini dilansir langsung melalui situs resmi Zyphra dan dikonfirmasi oleh VentureBeat serta MarkTechPost.

Alih-alih membangkitkan token satu per satu seperti model autoregresif konvensional, ZAYA1-8B-Diffusion-Preview mendifusikan blok 16 token sekaligus secara paralel — menghasilkan percepatan inferensi 4,6x dengan sampler lossless, dan 7,7x dengan sampler logit-mixing terbaru Zyphra. Loncatan kecepatan ini bukan sekadar angka di atas kertas: percepatan tersebut dicapai dengan menggeser proses decoding dari yang semula dibatasi bandwidth memori menjadi berbasis komputasi — keunggulan kritis seiring GPU modern yang terus meningkatkan kapasitas FLOP jauh lebih cepat daripada bandwidth memori.

Zyphra membuktikan bahwa model MoE autoregresif dapat dikonversi menjadi model difusi diskrit tanpa penurunan performa evaluasi yang sistematis. Proses konversi ini menggunakan resep TiDAR, di mana model base ZAYA1-8B menjalani pelatihan mid-training difusi selama 600 miliar token pada konteks 32k, kemudian diperluas secara native ke konteks 128k selama 500 miliar token, sebelum memasuki fase difusi SFT.

Dalam pernyataan resminya, tim Zyphra menyebut: “ZAYA1-8B-Diffusion-Preview adalah model difusi MoE pertama yang dikonversi dari LLM autoregresif dan yang pertama dilatih di atas AMD.”

ZAYA1-8B sendiri dibangun di atas arsitektur MoE++ milik Zyphra, yang memperkenalkan tiga perubahan mendasar dibanding Transformer standar, termasuk Compressed Convolutional Attention (CCA) yang melakukan sequence mixing di ruang laten terkompresi — menghasilkan kompresi KV-cache hingga 8x dibandingkan mekanisme multi-head attention konvensional. Keunggulan CCA menjadi kunci dalam konteks difusi: karena difusi mengonversi decoding menjadi prefill, CCA memungkinkan lebih banyak token didifusikan secara paralel sebelum mencapai batas komputasi.

Model induknya, ZAYA1-8B, dilatih pada kluster AMD Instinct MI300X khusus dengan jaringan AMD Pensando Pollara di infrastruktur IBM Cloud — membuktikan viabilitas hardware AMD untuk pelatihan model mutakhir di era yang masih didominasi ekosistem CUDA dari Nvidia. Model ini tersedia secara gratis di Hugging Face di bawah lisensi Apache 2.0, serta dapat diakses sebagai serverless endpoint di Zyphra Cloud.

Dengan kurang dari satu miliar parameter aktif, ZAYA1-8B berhasil meraih skor 91,9% pada benchmark AIME’25 — ajang olimpiade matematika di mana sebagian besar model frontier mentok di angka sekitar 90%. Teknik komputasi test-time Markovian RSA bahkan mendorong performa ZAYA1-8B melampaui Claude 4.5 Sonnet dan GPT-5-High pada benchmark HMMT’25 dengan skor 89,6 berbanding 88,3.

Hastag

#Model AI Open Source #Zyphra ZAYA1-8B #model difusi bahasa AI #Mixture of Experts MoE #inferensi AI lebih cepat

Berita Terkait

Teknologi

Apple Ubah Total Rencana Chip Mac, M6 Pro dan M6 Max Resmi Dibatalkan Demi Kejar AI

Apple batalkan M6 Pro dan M6 Max, percepat M7 demi AI. Simak bocoran spesifikasi, linimasa, dan produk yang bakal terdampak.

Hasida Kuchiki 13 Jul 2026

Era Snapdragon vs MediaTek Usai: Kelas Harga, Bukan Merek, Kini Tentukan Performa HP 2026

Teknologi

Terbaru

Teknologi 2 days ago

Serupa

Teknologi 3 months ago

Google Rilis Gemma 4, Model AI Open-Source Paling Canggih yang Bisa Dijalankan di HP hingga Server Enterprise

Teknologi 4 months ago

DeepSeek V4 Triliunan Parameter Siap Guncang Pasar AI Global April Ini, Tencent Hunyuan Ikut Hadir

Kategori

Teknologi 734

Nasional 697

Ekonomi 313

Daerah 258

Lifestyle 173

Sport 139

Zyphra Pecahkan Rekor Kecepatan AI: Model Difusi MoE Pertama di Dunia Capai 7,7x Lebih Cepat dari Autoregressive

Hastag

Berita Terkait

Apple Ubah Total Rencana Chip Mac, M6 Pro dan M6 Max Resmi Dibatalkan Demi Kejar AI

Era Snapdragon vs MediaTek Usai: Kelas Harga, Bukan Merek, Kini Tentukan Performa HP 2026

RESMI! Huawei Pura 90 Ganti Nama Jadi “Pura 90s Series” untuk Pasar Global, Meluncur 14 Juli di Kuala Lumpur

Indosat Pertahankan Bos Vikram Sinha 5 Tahun, All-In Kejar Ambisi Jadi Raksasa AI TechCo RI

Populer

Harga Emas Hari Ini Turun atau Naik? Cek Daftar Lengkap Harga per Gram

Tinggal Hitungan Hari! KUHP-KUHAP Baru Berlaku 2 Januari 2026, Ini Pasal-Pasal yang Paling Disorot Publik

Malam 1 Rajab 1447 H Mulai Bakda Maghrib Ini, Ini 7 Amalan yang Bisa Diamalkan Tanpa Mengada-ada Ritual Khusus

Harga RAM Melejit 500 Persen, Siap-siap PC dan Laptop Baru Jadi Barang Mewah Mulai 2026

Rabu Abu 18 Februari 2026, Ini Jadwal Lengkap Misa di Katedral Jakarta dan Status Liburnya

Terbaru

Apple Ubah Total Rencana Chip Mac, M6 Pro dan M6 Max Resmi Dibatalkan Demi Kejar AI

Era Snapdragon vs MediaTek Usai: Kelas Harga, Bukan Merek, Kini Tentukan Performa HP 2026

Ketua Karang Taruna Pamulang Targetkan Pemetaan Potensi Pemuda, Dorong Kolaborasi Nyata dengan Pemkot Tangsel

Pilar Minta Karang Taruna Jadi Mitra Strategis Pemkot, Fokus Perbarui Data Bansos agar Tepat Sasaran

Pilar Ingatkan Karang Taruna Tinggalkan Premanisme, Ajak Fokus pada Pengabdian dan Kegiatan Sosial

Serupa

Google Rilis Gemma 4, Model AI Open-Source Paling Canggih yang Bisa Dijalankan di HP hingga Server Enterprise

DeepSeek V4 Triliunan Parameter Siap Guncang Pasar AI Global April Ini, Tencent Hunyuan Ikut Hadir

Kategori