OpenAI kembali menggemparkan dunia kecerdasan buatan dengan peluncuran fitur generator gambar terbarunya, ChatGPT Images 2.0, yang resmi dirilis pada Selasa, 21 April 2026. Pembaruan ini diklaim membawa lompatan kualitas yang signifikan dibandingkan pendahulunya, ChatGPT Images 1.5, yang meluncur pada Desember 2025.
Dalam pernyataan resminya, OpenAI menekankan bahwa model terbaru ini mampu menghadirkan tingkat detail dan akurasi yang belum pernah dicapai sebelumnya. Kemampuannya dalam mengikuti instruksi pengguna, mempertahankan detail halus, hingga merender elemen-elemen kecil seperti teks dan ikon, kini meningkat pesat. Komposisi visual yang kompleks pun dapat dihasilkan dengan resolusi hingga 2K.
Kemampuan Berpikir dan Kontekstual
Salah satu terobosan utama ChatGPT Images 2.0 terletak pada kemampuannya untuk “berpikir”. Berbeda dengan model sebelumnya yang hanya sekadar menggambar berdasarkan perintah, versi 2.0 ini mampu menganalisis, merencanakan, dan menyusun struktur visual sebelum menghasilkan gambar. Hal ini menjadikan hasil akhir lebih kompleks dan sangat kontekstual.
Kemampuan berpikir ini membuka pintu bagi pengguna untuk menciptakan berbagai jenis konten visual yang sebelumnya sulit dicapai oleh AI generator gambar. Mulai dari infografis yang detail, slide presentasi yang menarik, peta yang akurat, hingga komik manga dengan beberapa panel sekaligus, semuanya kini dapat dibuat hanya dengan satu perintah.
Lebih lanjut, model ini diklaim mampu menghasilkan hingga delapan gambar sekaligus dengan karakter dan gaya yang konsisten. Namun, OpenAI mengingatkan bahwa basis pengetahuan model ini masih terbatas hingga Desember 2025. Oleh karena itu, untuk permintaan yang berkaitan dengan peristiwa terbaru, akurasi hasil mungkin belum sepenuhnya optimal.
Teks dalam Gambar Makin Jelas dan Akurat
Peningkatan lain yang patut disorot adalah kemampuan menampilkan teks di dalam gambar. Jika sebelumnya teks dalam gambar AI seringkali terlihat acak dan tidak terbaca, ChatGPT Images 2.0 kini mampu menghasilkan tipografi yang rapi dan jelas. Hal ini berlaku bahkan untuk komposisi yang kompleks seperti poster atau diagram ilmiah.
Tak hanya itu, model ini juga mendukung berbagai bahasa secara lebih akurat, termasuk karakter non-Latin seperti Jepang, Korea, China, Hindi, dan Bengali. Ini berarti gambar yang dihasilkan tidak hanya sekadar terjemahan, melainkan terasa alami dan sesuai dengan konteks bahasa masing-masing.
Pembaruan ini hadir di tengah persaingan ketat di industri AI gambar. Google sebelumnya juga merilis model serupa dengan kemampuan teks dalam gambar. Namun, OpenAI mengklaim model barunya unggul dalam hal detail, konsistensi, serta kemampuan menghasilkan banyak gambar sekaligus.
OpenAI juga menegaskan bahwa sistem ChatGPT Images 2.0 telah dilengkapi berbagai lapisan keamanan. Ini termasuk penandaan gambar (watermark) sebagai hasil AI dan pemantauan untuk mencegah penyalahgunaan, terutama terkait konten politik atau manipulatif.
Akses dan Ketersediaan
Dari sisi akses, versi dasar ChatGPT Images 2.0 tersedia untuk semua pengguna, termasuk yang menggunakan akun gratis, untuk kebutuhan standar. Sementara itu, pengguna berbayar seperti Plus dan Pro akan mendapatkan akses ke mode “Thinking”.
Mode “Thinking” ini memungkinkan AI untuk menggunakan alat tambahan seperti pencarian web, menganalisis file, hingga menghasilkan beberapa gambar sekaligus dalam satu alur kerja yang konsisten. Khusus untuk pengguna Pro, OpenAI juga menyediakan akses ke model “ImageGen Pro” untuk kebutuhan pembuatan gambar yang lebih kompleks.
Bagi para pengembang, OpenAI menghadirkan model gpt-image-2 melalui API yang mendukung resolusi hingga 4K, meski masih dalam tahap beta. API ini juga menawarkan rasio gambar yang fleksibel, mulai dari 3:1 hingga 1:3, sebagaimana dihimpun dari laman OpenAI dan VentureBeat.






