Daftar Isi Artikel
- Playbook Nano Banana, kerangka prompt untuk editing dan komposisi
- Persiapan lingkungan, API key dan alur kerja di AI Studio serta Vertex AI
- Tutorial uji coba, editing lokal presisi di Gemini 2.5 Flash Image
- Tutorial uji coba, komposisi multi gambar dan konsistensi karakter
- Strategi penulisan prompt, komposisi, dan tip praktis
- Kontrol biaya dan perencanaan anggaran penggunaan API
- Tata kelola, watermark SynthID, etika dan kepatuhan
- Troubleshooting dan checklist eksekusi cepat
- Template prompt Nano Banana siap pakai
- Saatnya Mencoba, Uji Playbook Nano-Banana Anda
Margabagus.com – Gelombang baru pembuatan dan pengeditan gambar dengan bahasa natural datang dari Gemini 2.5 Flash Image, tersedia di Gemini API, Google AI Studio, serta Vertex AI, yang memadukan pemahaman dunia nyata dengan kontrol kreatif yang presisi. Model ini menonjol pada inpaint, outpaint, penggantian latar, fusion multi gambar, serta konsistensi karakter yang sebelumnya sulit dicapai dengan stabil dan cepat.[1] [3] [4]
Bagi tim konten dan produk, aspek biaya menjadi penentu. Sebagai ilustrasi perhitungan resmi Google:[2]
Biaya ≈ US$0.039 per gambar 1024×1024 piksel (kurs 1 USD ≈ Rp16.449 → ≈ Rp637 per gambar 1024×1024 piksel). Angka rujukan ini memudahkan kalkulasi ROI saat Anda menargetkan produksi visual dalam jumlah besar. Rumus: (1.290 / 1.000.000) × US$30.00 = US$0.039.
Di lini tata kelola, setiap hasil yang dibuat atau diedit disematkan watermark tak terlihat SynthID untuk menandai media buatan AI, sementara di aplikasi Gemini juga ada watermark terlihat, langkah ini menjadi fondasi transparansi ekosistem media generatif.[6] [7]
Playbook Nano Banana, kerangka prompt untuk editing dan komposisi

Skema blok Nano Banana, subjek, aksi, konteks, komposisi, latar, aturan negatif, ukuran, cahaya
Istilah Nano Banana sering dipakai komunitas dan di kanal resmi Google untuk menyebut varian Gemini 2.5 Flash Image. Dalam artikel ini, saya memakai Nano Banana sebagai kerangka prompt praktis yang konsisten, bukan fitur resmi, agar Anda dan tim dapat menyusun instruksi yang rapi, dapat diulang, serta mudah diukur dampaknya.[1]
Kerangka ini memecah prompt menjadi blok mikro yang fokus pada satu aspek visual agar model tidak kebanjiran konteks. Struktur di bawah ini sengaja ringkas supaya mudah dipakai di produksi.
Struktur Nano Banana
-
Nama subjek, identitas yang jelas, contoh, minifigure atlet lari, sepatu merah, kaos nomor tiga
-
Aksi dan niat, apa yang dilakukan, contoh, menekuk lutut, lengan terayun, menatap kamera
-
Narasi konteks, kegunaan atau cerita, contoh, poster lomba lari komunitas akhir pekan
-
Orientasi kamera dan framing, contoh, sudut tiga perempat, rule of thirds, fokus di wajah
-
Background dan lingkungan, contoh, latar studio putih, bayangan lembut
-
Aturan negatif, hal yang harus dihindari, contoh, tanpa teks kabur, tanpa noise, tanpa warna kusam
-
Nilai teknis, ukuran, rasio, format respons, contoh, 1024 kali 1024, gaya foto editorial
-
Atribut cahaya dan warna, contoh, softbox kanan, suhu warna netral, kontras menengah
Dengan pola ini, prompt menjadi terstruktur, terukur, dan dapat direplikasi lintas use case seperti penghapusan objek, pergantian latar, komposisi multi gambar, serta konsistensi karakter.[9]
Persiapan lingkungan, API key dan alur kerja di AI Studio serta Vertex AI

Alur eksperimen di AI Studio menuju produksi di Vertex AI, termasuk penyimpanan aset dan kontrol biaya
Saya menyarankan memulai di Google AI Studio untuk eksperimen cepat, kemudian memindahkan alur kerja ke Vertex AI untuk orkestrasi produksi dan kontrol biaya. Model gemini 2.5 flash image tersedia melalui Gemini API serta Vertex AI, dengan dokumentasi lengkap untuk pembuatan, pemahaman gambar, serta penyuntingan berbasis teks . fn n=”1″] [3] [4] [8]
Untuk input gambar, Anda dapat menyisipkan data secara inline untuk berkas kecil atau menggunakan File API bila ingin memakai ulang aset yang sama lintas permintaan. Perhatikan batas ukuran permintaan saat mengirim data inline agar proses tetap andal.[8]
Di lingkungan produksi, Vertex AI memudahkan inpaint, outpaint, penggantian latar, serta personalisasi dengan pola pipeline yang jelas. Integrasi ini memudahkan logging, versioning, serta pengaturan izin pada tim besar.[3]
Contoh kode Python, generasi dan simpan hasil
from google import genai
from PIL import Image
from io import BytesIO
client = genai.Client() # gunakan kunci API Gemini Anda
prompt = (
"N: produk botol minum stainless, A: berdiri tegak, "
"N: untuk katalog e-commerce, O: sudut tiga perempat, "
"B: latar putih bersih, A: tanpa glare, tanpa noise, "
"N: 1024x1024, A: cahaya softbox kanan"
)
resp = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=
Prompt #1
,
)
for part in resp.candidates[0].content.parts:
if part.inline_data is not None:
img = Image.open(BytesIO(part.inline_data.data))
img.save("produk-botol-1024.png")
Contoh di atas mengikuti pola resmi di blog pengembang, model dengan sufiks preview dapat berubah menjadi stabil, pantau halaman model untuk nama terkini.[1] [5] [11]
Contoh kode, edit berbasis teks dengan input gambar
base = Image.open("produk-botol-asli.png")
edit_prompt = (
"N: produk botol minum stainless, A: perbaiki glare di bodi, "
"N: untuk katalog, O: crop medium, B: latar putih, "
"A: hilangkan noda di label, N: 1024x1024, A: cahaya netral"
)
resp = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=[edit_prompt, base],
)
# simpan seperti contoh sebelumnya
Pemanggilan ini memanfaatkan pola image plus text to image untuk mengedit, sesuai dokumentasi Gemini API.[4]
Contoh JavaScript, alur cepat dengan AI SDK modern
import { google } from "@ai-sdk/google";
import { generateText } from "ai";
import fs from "node:fs";
const provider = google({ apiKey: process.env.GOOGLE_API_KEY });
const model = provider("gemini-2.5-flash-image-preview");
const prompt = `
N: logo festival kopi modern, A: tipografi jelas terbaca,
N: poster digital, O: komposisi simetris,
B: latar gelap, A: tanpa teks kabur,
N: 1024x1024, A: pencahayaan dramatis
`;
const { text, response } = await generateText({
model,
prompt,
});
// jika respons menyertakan bagian gambar interleaved, simpan sesuai dokumentasi SDK
Pada beberapa SDK, pembuatan gambar terjadi sebagai respons multimodal dalam fungsi teks, model memutuskan keluaran berdasarkan permintaan Anda.[10] [12]
Baca juga: Cara Mengoptimalkan Prompt ChatGPT, Gemini, dan Claude: Rahasia Tingkatkan Performa AI untuk Hasil Lebih Akurat
Tutorial uji coba, editing lokal presisi di Gemini 2.5 Flash Image

Panel tiga langkah, hapus objek, koreksi pose ringan, ganti latar studio dengan soft shadow
Bagian ini berfokus pada agar bisa dipraktikkan oleh Anda dan tim. Kita mulai dari tiga skenario yang paling sering dipakai, yaitu menghapus objek, memperbaiki kualitas wajah atau pose, serta mengganti latar.
A. Menghapus objek yang mengganggu
-
Tujuan: foto produk memiliki stiker harga yang menutupi label.
-
Langkah
- Unggah foto asli ke AI Studio atau panggil API dengan input gambar.
- Tulis prompt Nano Banana, sebutkan objek yang harus dihapus dan area umum.
- Tambahkan aturan negatif agar model tidak mengubah bagian penting.
-
Prompt Nano Banana
N: botol kecap kaca, A: hapus stiker harga di label depan, N: untuk katalog, O: crop close up, B: latar putih, A: jangan ubah tekstur kaca, jangan ubah bentuk label, N: 1024x1024, A: cahaya netral
Fungsi ini memanfaatkan inpaint yang tersedia di Vertex AI untuk kasus produksi, walau di AI Studio Anda cukup memberi instruksi bahasa natural.[3]
B. Memperbaiki pose subjek
-
Tujuan: mengganti gaya tangan model agar tampak menyapa kamera.
-
Langkah
- Unggah foto model.
- Instruksikan perubahan mikro di tangan dan bahu, tambah konteks pencahayaan.
- Minta variasi satu sampai tiga agar bisa memilih.
-
Prompt
N: model pria kemeja putih, A: ubah pose tangan kanan melambai ringan, N: foto profil profesional, O: sudut tiga perempat, B: latar studio abu terang, A: tanpa distorsi wajah, tanpa noise, N: 1024x1024, A: cahaya softbox kanan
C. Mengganti latar dan kontrol bayangan
-
Tujuan: memindahkan produk dari latar rumah ke studio putih, tetap ada soft shadow agar natural.
-
Prompt
N: sepatu lari merah, A: potong dari latar asli dan taruh di latar studio putih, N: untuk katalog e-commerce, O: komposisi rule of thirds, B: latar putih dengan soft shadow halus di bawah, A: tanpa tepi bergerigi, N: 1024x1024, A: cahaya lembut menyebar
Ketiga skenario di atas mencontohkan penyuntingan berbasis teks yang menjadi kekuatan Gemini 2.5 Flash Image.[1] [4] [9]
Tutorial uji coba, komposisi multi gambar dan konsistensi karakter

Fusion produk ke latar tematik dan maskot tampil konsisten di beberapa adegan, palet warna terjaga
Komposisi multi gambar mempercepat pembuatan aset kampanye tanpa sesi foto baru. Di Gemini, Anda bisa menggabungkan beberapa input untuk membuat adegan baru, sekaligus mempertahankan rupa subjek agar konsisten di beberapa scene.[1] [4]
D. Fusion dua gambar, produk ke lingkungan baru
-
Input: foto produk di meja kantor, foto latar kafe modern.
-
Prompt
N: cangkir kopi keramik matte hitam, A: letakkan di meja kafe modern, N: foto kampanye media sosial, O: sudut tiga perempat, B: latar kafe bokeh hangat, A: proporsi realistis, hindari skala tidak wajar, N: 1024x1024, A: cahaya hangat jam golden hour
E. Konsistensi karakter untuk storytelling pendek
-
Target: karakter maskot brand muncul di tiga latar, taman kota, toko, halaman rumah.
-
Strategi
- Buat gambar referensi maskot, simpan di File API.
- Pada tiap adegan, panggil referensi yang sama dan instruksikan kostum, pose, aksesoris.
- Gunakan aturan negatif yang sama, tanpa perubahan proporsi wajah, tanpa perubahan palet warna utama.
-
Prompt contoh
N: maskot panda memakai apron hijau, A: membawa tas belanja, N: poster promo toko bahan organik, O: frontal dengan sedikit tilt, B: interior toko cerah, A: jangan ubah pola bulu dan warna apron, N: 1024x1024, A: cahaya lembut
Fitur multi image fusion dan character consistency merupakan sorotan utama rilis ini, memudahkan penceritaan visual berantai.[1]
Strategi penulisan prompt, komposisi, dan tip praktis

Papan strategi berisi checklist, rule of thirds, arah cahaya, serta blok Nano-Banana singkat
Akurasi prompt meningkat saat instruksi spesifik namun tidak bertumpuk. Terapkan tiga prinsip, jelas, terukur, dan kontekstual.
-
Jelas berarti subjek dan aksi mendapat prioritas.
-
Terukur berarti rasio, ukuran, serta kualitas dituliskan.
-
Kontekstual berarti tujuan penggunaan memandu gaya dan komposisi.
Gemini 2.5 Flash Image juga menunjukkan text rendering yang lebih bersih untuk poster, diagram, dan logo, Anda tetap perlu iterasi singkat agar tata letak huruf konsisten.[9]
Checklist singkat sebelum kirim prompt
-
Subjek, aksi, tujuan, komposisi, latar, aturan negatif, ukuran.
-
Cahaya, suhu warna, kontras, saturasi, gaya foto atau ilustrasi.
-
Permintaan variasi sebagai cadangan pilihan.
Kontrol biaya dan perencanaan anggaran penggunaan API
Pemakaian besar menuntut perhitungan yang lugas.[2]
Biaya ≈ US$0.039 per gambar 1024×1024 piksel (kurs 1 USD ≈ Rp16.449 → ≈ Rp637 per gambar 1024×1024 piksel). Skenario 50×22 = 1.100 gambar per bulan; ini biaya output. Tambahkan buffer untuk token input, variasi, dan percobaan ulang.
Untuk penghematan, gunakan pola draft cepat pada ukuran menengah, simpan versi yang terbaik, lalu minta variasi final terbatas. Hindari permintaan berlebihan pada detail minor yang tidak terlihat di perangkat mobile.
Tata kelola, watermark SynthID, etika dan kepatuhan
Transparansi adalah pilar kepercayaan. SynthID menyematkan watermark tak terlihat pada setiap gambar yang dibuat atau diedit, rancang proses internal yang mencatat asal media, terutama untuk iklan dan publisitas.[6] [7]
Untuk verifikasi, Google memperkenalkan detektor SynthID agar platform dapat menguji konten yang diunggah. Walaupun deteksi bukan solusi tunggal, ini langkah berarti untuk akuntabilitas ekosistem media generatif.[13]
Gabungkan dengan kebijakan editorial internal, cantumkan atribusi penggunaan AI bila relevan, serta hindari penggunaan yang berpotensi menyesatkan publik.
Troubleshooting dan checklist eksekusi cepat
-
Wajah atau tangan tidak konsisten, perkecil perubahan per langkah, tegaskan aturan negatif, tanpa ubah proporsi wajah.
-
Latar masih kasar, minta perbaikan tepi, tambahkan soft shadow agar objek menyatu, ulangi dengan instruksi satu kalimat fokus.
-
Teks kurang rapi, minta ulang dengan batas karakter, contoh, judul maksimal dua kata, gunakan kata pendek bernada kuat.
-
Komposisi terasa datar, ubah orientasi kamera, sudut tiga perempat, tambah highlight halus pada tepi objek.
Template prompt Nano Banana siap pakai
Semua template ini dirancang agar langsung bisa ditempel ke AI Studio atau API Anda. Silakan sesuaikan kata benda, konteks, serta ukuran.
1. Edit noda atau bercak pada produkN: jaket kulit hitam, A: hilangkan bercak putih di sisi kanan dada, N: katalog fashion, O: crop close up dada, B: latar abu terang, A: jangan ubah tekstur kulit, N: 1024x1024, A: cahaya lembut
2. Hapus objek di latarN: meja kayu dan vas bunga, A: hapus botol plastik di belakang vas, N: foto interior, O: sudut tiga perempat, B: ruang tamu hangat, A: jangan ubah pola kayu meja, N: 1024x1024, A: cahaya natural
3. Ganti latar studio putih dengan bayangan halusN: headphone hitam matte, A: pindah ke latar putih dengan soft shadow, N: katalog, O: komposisi simetris, B: latar putih bersih, A: tanpa tepi bergerigi, N: 1024x1024, A: cahaya diffuse
4. Koreksi pose ringanN: model wanita, A: perbaiki arah pandang sedikit ke kamera, N: profil LinkedIn, O: tiga perempat, B: latar abu netral, A: jangan ubah proporsi wajah, N: 1024x1024, A: softbox kanan
5. Fusion dua gambar, produk ke scene tematikN: botol minuman isotonik, A: letakkan di lintasan atletik, N: poster kampanye, O: sudut rendah dramatis, B: stadion sore hari, A: skala proporsional, N: 1024x1024, A: cahaya hangat
6. Variasi warna produk tetap konsistenN: sepatu lari model X, A: ganti warna menjadi biru tua, N: katalog varian warna, O: close up samping, B: latar abu terang, A: jangan ubah bentuk outsole, N: 1024x1024, A: cahaya netral
7. Text rendering untuk posterN: poster festival kopi, A: tulis judul "KOPI KITA", N: tipografi tegas dan bersih, O: komposisi terpusat, B: latar gelap, A: tanpa teks kabur, N: 1024x1024, A: kontras tinggi
8. Personal branding foto profilN: pengusaha pria dengan jas navy, A: senyum kecil, N: foto profil profesional, O: tiga perempat, B: latar studio abu, A: tanpa kilap berlebih di dahi, N: 1024x1024, A: pencahayaan lembut
9. Produk kaca tanpa glareN: vas kaca transparan, A: kurangi glare, N: katalog dekorasi, O: close up, B: latar putih, A: pertahankan bentuk asli, N: 1024x1024, A: cahaya menyebar
10. Maskot brand konsisten lintas adeganN: maskot rubah oranye, A: berlari sambil membawa paket, N: iklan logistik, O: sudut tiga perempat, B: gudang rapi, A: jangan ubah pola bulu dan warna, N: 1024x1024, A: cahaya netral
Catatan, kemampuan iterasi percakapan memudahkan perbaikan langkah kecil dari satu percobaan ke percobaan berikutnya, sesuai anjuran praktik resmi.[9]
Baca juga: Panduan Lengkap Audio Overview di Gemini Deep Research: Mengubah Laporan Menjadi Podcast AI
Saatnya Mencoba, Uji Playbook Nano-Banana Anda

Ajakan bertindak, checklist eksperimen singkat dan kursor mengarah ke tombol generate
Gemini 2.5 Flash Image memberi cara kerja baru yang cepat dan ekonomis, apalagi bila Anda memakai playbook Nano Banana yang konsisten. Saya mendorong Anda mencoba uji kasus nyata, dari katalog produk hingga poster event, ukur hasilnya, lalu bagikan pengalaman di kolom komentar agar kita bisa belajar bersama.
References
- Google Developers Blog — Introducing Gemini 2.5 Flash Image ↩
- Google AI for Developers — Gemini API Pricing ↩
- Vertex AI Docs — Gemini 2.5 Flash, Edit images, inpaint, outpaint ↩
- Google AI for Developers — Image generation with Gemini ↩
- Google Blog — We’re expanding our Gemini 2.5 family of models ↩
- Google DeepMind — SynthID ↩
- Google Blog — Image editing in Gemini, visible watermark and SynthID ↩
- Google AI for Developers — Passing images and File API ↩
- Google Developers Blog — How to prompt Gemini 2.5 Flash Image ↩
- Vertex AI Docs — Interleaved images and text generation ↩
- Google AI Studio — Model page Gemini 2.5 Flash Image ↩
- The Verge — SynthID Detector overview ↩