Adu Foto AI Buatan ChatGPT dan Google Gemini, Mana Lebih Realistis?
Teknologi kecerdasan buatan (AI) terus berkembang pesat, terutama dalam bidang generatif visual, di mana AI
mampu menciptakan gambar atau foto hanya dari perintah teks. Dua pemain besar dalam dunia AI, yakni OpenAI dengan
ChatGPT dan Google dengan Gemini, kini saling bersaing dalam menghadirkan hasil gambar AI yang realistis dan menawan.
Persaingan ini semakin menarik ketika keduanya merilis fitur image generation terbaru yang memungkinkan pengguna
membuat gambar hanya dengan mengetik deskripsi. Lalu, siapa yang menghasilkan gambar paling realistis? Mana yang lebih unggul
dalam detail, warna, dan komposisi? Artikel ini mengulas perbandingan kemampuan ChatGPT dan Google Gemini
dalam menciptakan foto AI, mulai dari hasil visual, kecepatan, hingga pengalaman pengguna.

ChatGPT dengan DALL·E: Visual Kreatif dan Tajam
OpenAI mengintegrasikan DALL·E 3 ke dalam ChatGPT untuk menghasilkan gambar AI yang dapat diminta melalui prompt teks.
Teknologi ini menggunakan pendekatan generatif berbasis diffusion model yang menghasilkan gambar secara bertahap, dari noise menjadi bentuk yang utuh.
Dalam pengujian, DALL·E 3 mampu menciptakan gambar dengan:
-
Detail yang tajam dan kontras tinggi
-
Ekspresi wajah manusia yang ekspresif
-
Pencahayaan sinematik
-
Komposisi yang seimbang meski dengan prompt rumit
Contoh prompt:
“Seorang anak kecil memakai jas hujan kuning berdiri di tengah jalan kota yang basah dengan latar belakang gedung pencakar langit dan langit senja.”
Hasil dari DALL·E sangat impresif: bayangan air hujan di jalan terlihat, pencahayaan senja dibuat dramatis, dan jas hujan kuning tampak menonjol dari latar.
Google Gemini: Realisme Alami dan Warna Natural
Google melalui Gemini AI (generasi penerus Bard dan Google Imagen) juga menawarkan layanan text-to-image
dengan kemampuan yang tak kalah canggih. Berbeda dengan DALL·E yang cenderung artistik dan imajinatif, gambar dari Gemini lebih menekankan pada:
-
Realisme tinggi
-
Warna-warna natural
-
Pencahayaan yang seimbang
-
Struktur wajah manusia yang menyerupai foto sungguhan
Contoh prompt sama seperti di atas, namun hasil dari Gemini memperlihatkan pendekatan lebih natural
langit dibuat lebih lembut, bayangan lebih realistis, dan ekspresi wajah anak terlihat seperti hasil jepretan kamera DSLR.
Perbandingan Hasil: Mana Lebih Baik?
Aspek | ChatGPT (DALL·E 3) | Google Gemini |
---|---|---|
Realisme Wajah | Bagus, namun sedikit ‘kartunis’ | Sangat realistis, mirip foto |
Pencahayaan | Kontras sinematik | Natural dan halus |
Warna | Cerah, kadang terlalu artistik | Seimbang dan alami |
Respons Prompt Kompleks | Akurat dan detil | Akurat namun lebih aman (filter tinggi) |
Kecepatan Generasi | Sekitar 10–15 detik | 5–10 detik |
Secara umum, ChatGPT unggul untuk prompt yang artistik, imajinatif, atau sinematik, sementara
Gemini lebih unggul untuk hasil realistis dan natural seperti fotografi manusia, arsitektur, atau alam.
Kemudahan Penggunaan
Di sisi user experience, ChatGPT memberikan akses langsung ke fitur image generation dari satu jendela percakapan. Anda bisa:
-
Mengedit gambar
-
Memberi instruksi ulang
-
Meminta variasi gambar
Sementara Gemini juga terintegrasi dalam ekosistem Google, dan tampilannya sederhana. Namun, sistem keamanannya sangat ketat.
Prompt yang sensitif (seperti wajah selebriti atau isu kontroversial) seringkali tidak menghasilkan gambar.
Penggunaan Populer: Mana Lebih Diminati?
Para pengguna konten digital, kreator media sosial, dan pengusaha desain kini banyak menggunakan AI ini untuk:
-
Thumbnail YouTube
-
Konten Instagram
-
Ilustrasi artikel
-
Gambar untuk promosi produk
Dalam konteks ini, ChatGPT banyak dipilih karena bisa menghasilkan gambar dengan gaya unik dan mencolok, cocok untuk kebutuhan pemasaran visual.
Di sisi lain, Gemini menjadi andalan untuk pembuatan gambar dengan gaya realistis untuk presentasi, berita, atau bahan edukasi.
Risiko dan Etika Penggunaan Gambar AI
Meski menarik, penggunaan gambar dari AI tetap perlu mempertimbangkan:
-
Hak cipta & privasi
-
Penggunaan pada konten sensitif
-
Manipulasi informasi (deepfake)
Baik OpenAI maupun Google telah memasang watermark digital dan sistem moderasi konten untuk mencegah penyalahgunaan.
Namun, pengguna tetap diimbau bertanggung jawab dan tidak menggunakan gambar AI untuk tujuan menyesatkan.
Baca juga:Viral di Medsos Gambar AI Realistis yang Dibuat dengan Gemini, Ini Caranya
Kesimpulan: Pilih Sesuai Kebutuhan
Tidak ada yang benar-benar “lebih baik”, karena hasil terbaik tergantung pada konteks dan tujuan penggunaan. Jika
Anda membutuhkan gambar bergaya dramatis, sinematik, dan kreatif, maka ChatGPT dengan DALL·E 3 bisa menjadi pilihan ideal.
Namun jika Anda mengutamakan gambar realistis, tenang, dan menyerupai dunia nyata, maka Google Gemini adalah alternatif unggulan.
Teknologi terus berkembang, dan ke depan, persaingan ChatGPT dan Gemini akan menghadirkan inovasi lebih hebat.
Yang pasti, kita sebagai pengguna punya pilihan lebih banyak dan lebih kuat dalam menciptakan visual dari kata-kata.