TEKNOLOGI, Perspektif.co.id — OpenAI secara resmi meluncurkan ChatGPT Images 2.0 pada 21 April 2026, menandai babak baru dalam teknologi pembuatan gambar berbasis kecerdasan buatan yang tidak sekadar merender visual, tetapi kini mampu bernalar, memverifikasi hasilnya sendiri, dan menghasilkan hingga delapan gambar koheren dari satu perintah tunggal. Model baru ini, tersedia melalui API dengan nama gpt-image-2, mulai bergulir ke seluruh pengguna ChatGPT dan Codex, sekaligus menggantikan GPT Image 1.5 yang selama ini mendominasi leaderboard LM Arena. Peluncuran ini bukan sekadar pembaruan inkremental—melainkan pergeseran filosofis fundamental dalam cara OpenAI mendefinisikan ulang peran gambar dalam ekosistem AI.
Model baru ini menggantikan GPT Image 1.5 dan menandai perubahan signifikan dalam pendekatan OpenAI terhadap pembuatan gambar. Alih-alih hanya mengeksekusi perintah visual secara langsung, Images 2.0 merupakan model gambar pertama OpenAI yang dilengkapi kemampuan berpikir (native thinking) bawaan, yang memungkinkan sistem meluangkan waktu untuk menafsirkan instruksi kompleks sebelum akhirnya menghasilkan output. Pendekatan ini, sebagaimana dilaporkan The Decoder, menjadikan model jauh lebih andal dalam menangani skenario visual yang sebelumnya membuat model-model pendahulunya kesulitan.
OpenAI secara resmi meluncurkan ChatGPT Images 2.0 pada 21 April 2026, menandai kehadiran model yang sebelumnya sudah dipantau melalui LM Arena sejak Desember 2025 di bawah berbagai nama kode seperti Chestnut, Hazelnut, hingga yang paling terbaru packingtape-alpha dan gaffertape-alpha. Perjalanan panjang pengembangan senyap ini mencerminkan betapa serius OpenAI mempersiapkan model sebelum membawanya ke publik luas.
Ketika pelanggan Plus, Pro, Business, atau Enterprise mengaktifkan mode Thinking, model memperoleh kemampuan tambahan: menelusuri web untuk mendapatkan informasi real-time selama proses pembuatan gambar, menciptakan beberapa gambar yang berbeda dari satu perintah, dan memverifikasi ulang hasilnya sebelum dikirimkan ke pengguna. Fitur-fitur canggih ini tidak tersedia di tingkat gratis, tetapi OpenAI memastikan bahwa peningkatan kualitas gambar secara keseluruhan dapat dinikmati oleh semua pengguna tanpa terkecuali.
Dalam pernyataan resminya sebagaimana dikutip VentureBeat, OpenAI menegaskan filosofi di balik pembaruan ini. “Gambar adalah bahasa, bukan hiasan. Gambar yang baik melakukan apa yang dilakukan oleh kalimat yang baik—memilih, mengatur, dan mengungkapkan,” demikian bunyi pernyataan resmi OpenAI dalam blog peluncurannya, sebagaimana dilaporkan VentureBeat.
Terlepas dari apakah mode Thinking diaktifkan atau tidak, seluruh pengguna ChatGPT mendapatkan peningkatan kualitas gambar. OpenAI menyatakan generator kini lebih baik dalam menangkap “karakteristik khas foto” dan menghadirkan peningkatan untuk pixel art, manga, potongan film, serta berbagai tipe gambar lainnya. Kemampuan menangani teks kecil, ikonografi, elemen UI, komposisi padat, dan instruksi gaya yang halus—semua area yang selama ini menjadi titik lemah model-model gambar generasi sebelumnya—kini diklaim telah ditangani dengan jauh lebih baik oleh Images 2.0.
Model baru ini juga menghadirkan pemahaman multibahasa yang lebih baik dan mampu merender teks non-Latin seperti Jepang, Korea, China, Hindi, dan Bengali dengan akurasi yang meningkat signifikan. Kemampuan ini menjadi krusial bagi pasar berkembang seperti Asia Tenggara, termasuk Indonesia, di mana kreator konten lokal selama ini harus bergulat dengan keterbatasan model AI dalam memahami skrip non-Latin.
OpenAI mengkonfirmasi bahwa model ini juga dapat menghasilkan denah lantai, grid gambar, kumpulan banyak gambar kecil, serta model karakter dari berbagai sudut pandang, dan menerapkan hampir semua fitur tersebut pada gambar yang diunggah oleh pengguna. Kapabilitas ini membuka pintu bagi penggunaan profesional yang jauh melampaui sekadar pembuatan ilustrasi sederhana—mulai dari prototyping arsitektur visual, pembuatan aset desain game, hingga produksi serial konten media sosial berskala besar.
Dukungan rasio aspek berkisar dari 3:1 (ultra-lebar) hingga 1:3 (ultra-tinggi), mencakup berbagai format mulai dari banner dan slide presentasi hingga layar ponsel. Resolusi mencapai 2K melalui API. Sementara itu, integrasi ke dalam Codex menjadi langkah strategis yang signifikan: desainer dan pengembang kini dapat menghasilkan mockup UI, prototipe, dan aset visual di dalam ruang kerja agentic yang sama yang menangani coding, slides, dan otomasi browser, hanya dengan satu langganan ChatGPT tanpa memerlukan API key terpisah.
Dari sisi penetapan harga untuk pengembang, OpenAI menerapkan sistem berbasis token: USD 8 (sekitar Rp 131.000) per juta image input token dan USD 30 (sekitar Rp 491.000) per juta image output token. Kurs referensi: 1 USD = Rp 16.350 (Bank Indonesia, April 2026). Dalam praktiknya, biaya per gambar bervariasi tergantung kualitas dan resolusi: gambar berukuran 1024x1024 pada kualitas rendah hanya dikenai USD 0,006 (sekitar Rp 98), kualitas menengah USD 0,053 (sekitar Rp 867), dan kualitas tinggi USD 0,211 (sekitar Rp 3.450).
Dengan DALL·E 2 dan 3 yang dijadwalkan pensiun pada 12 Mei mendatang, peluncuran ini juga menutup celah komersial yang ditinggalkan oleh penghentian model-model lama tersebut dan memposisikan pembuatan gambar sebagai antarmuka inti, bukan sekadar fitur sampingan. OpenAI menyebut iklan terlokalisasi, infografik, konten edukatif, alat desain, dan platform kreatif sebagai target kasus penggunaan utama yang diharapkan mendorong adopsi gpt-image-2 secara masif di kalangan pengembang dan bisnis global.