Diterbitkan pada 16 Mei 2026 8 mnt baca

Cara Menulis Prompt Gemini Omni di 2026: Panduan Praktis Prompt AI Video Multimodal

Kerangka prompt 2026 untuk model Gemini Omni yang bocor dari Google. Persona, task, format, context — plus kamera, audio, dan aset referensi — semua dalam satu brief.

Gemini OmniRekayasa PromptAI VideoPraktik Terbaik2026

Mengapa menulis prompt untuk Omni berbeda

Sebagian besar prompt AI video yang ditulis pada 2024–2025 dirancang untuk model video spesialis berkonteks pendek. Anda menulis satu kalimat, memilih preset gaya, menekan generate. Dengan Gemini Omni — model multimodal terpadu bocoran Google — prompt mengerjakan jauh lebih banyak. Satu prompt yang sama mengarahkan teks, gambar, video, dan audio tersinkron di dalam jendela konteks panjang.

Itu menggeser prompt dari “deskripsikan adegan” menjadi “deskripsikan seluruh deliverable.” Panduan ini adalah kerangka kerja untuk mendapatkan hasil maksimal dari Omni begitu mendarat, dengan teknik yang dipinjam dari panduan prompt resmi Google dan kartu preview Omni bocoran.

Kerangka empat-bagian: Persona · Task · Format · Context

Playbook prompt Google yang lebih luas untuk keluarga Gemini merekomendasikan empat blok bangunan:

Persona — keahlian yang Anda ingin model serap (“bertindak sebagai sinematografer”, “sebagai desainer brand”, “sebagai editor dokumenter”).
Task — apa yang Anda ingin produksi (“hero shot 10 detik dari headphone baru”, “product reveal 9:16”).
Format — batasan struktural (“16:9, 1080p, tracking shot lambat, pencahayaan golden-hour”).
Context — brand, audiens, dan material referensi yang harus diambil model.

Untuk Omni, ini memetakan langsung ke struktur brief yang bersih:

Kamu adalah [PERSONA].
Hasilkan [TASK].
Format: [rasio aspek, durasi, resolusi, bahasa kamera, pencahayaan].
Context: [voice brand, audiens, referensi, isyarat audio].

Contoh nyata:

Kamu adalah sinematografer mewah ala Wong Kar-wai. Hasilkan hero shot 10 detik dari headphone wireless hitam matte yang bertumpu pada alas beton bertekstur. Format: 16:9, 1080p, tracking shot 35mm lambat dari kiri-kamera ke kanan-kamera, back-light golden-hour lembut, depth of field dangkal. Context: brand adalah audio premium Skandinavia minimalis. Audio: drone atmosferik rendah dengan satu pukulan bel halus pada 0:07 ketika kamera melewati tanda brand. Gambar referensi: lihat foto produk terlampir untuk warna dan jahitan yang tepat.

Tiga C: Concise, Clear, Consistent

Panduan referensi prompt Google menekankan tiga prinsip yang berlaku rapi untuk Omni:

Concise. Panjang tidak sama dengan baik. Buang kata pengisi. Pertahankan satu subjek utama dan satu aksi utama per prompt.
Clear. Hindari deskriptor ambigu seperti “buat lebih bagus” atau “lebih sinematik.” Ganti dengan instruksi konkret: “tingkatkan depth of field”, “suhu warna lebih hangat”, “gerakan kamera lebih lambat pada 0,5x kecepatan.”
Consistent. Gunakan kosakata sama untuk konsep sama lintas iterasi. Jika Anda menyebutnya “tracking shot” sekali, jangan beralih ke “dolly move” kemudian — model memperlakukan itu sebagai sinyal berbeda.

Manfaatkan prompt berlapis dan berkonteks panjang

Tidak seperti model video berkonteks pendek, Omni mewarisi jendela konteks panjang Gemini. Itu berarti Anda dapat — dan sebaiknya — menulis prompt berlapis dan deskriptif. Brief produktif mencakup:

Subjek: siapa atau apa di frame, termasuk referensi pengunci identitas.
Mood: register emosional dan pacing.
Kamera: lensa, gerakan, perubahan framing dalam klip.
Pencahayaan: sumber, arah, suhu warna, kontras.
Dialog: setiap baris yang diucapkan, dengan waktu lip-sync jika relevan.
Sound design: bed ambient, genre musik, isyarat suara kunci dengan timecode.
Konteks brand atau gaya: referensi pada karya yang ada atau bahasa visual.

Anda pada dasarnya menulis treatment satu halaman, bukan kalimat. Konteks panjang Omni dibangun untuk ini.

Manfaatkan aset referensi secara agresif

Daftar fitur Omni bocoran secara eksplisit menyoroti input referensi: gambar, klip video, dan trek audio semua dapat digabungkan dalam satu instruksi. Penggunaan konkret:

Character lock: lampirkan gambar referensi protagonis untuk menjaga konsistensi lintas beberapa omni-clip.
Style lock: lampirkan frame dari karya yang ada untuk mengunci color grade dan komposisi.
Motion lock: lampirkan video referensi pendek untuk meniru gerakan kamera atau aksi karakter.
Beat lock: lampirkan trek musik dan minta Omni memotong visual ke beat (terutama berguna untuk Reels dan klip musik).

Aset referensi membawa sinyal jauh lebih banyak per byte dibanding teks saja. Prompt 30 kata dengan tiga gambar referensi hampir selalu mengungguli prompt 300 kata tanpa referensi.

Edit dalam chat, bukan regenerasi

Pergeseran workflow tunggal terbesar yang dirumorkan Omni adalah editing langsung dalam chat. Alih-alih meregenerasi seluruh klip ketika satu elemen salah, Anda dapat meminta:

“Tukar jam di pergelangan model dengan chronograph perak gosok. Jaga semua framing, pencahayaan, dan audio lain persis sama.”

“Pelan gerakan kamera 30% dan hangatkan suhu warna 200 K.”

“Hapus pukulan bel pada 0:07 dan tambahkan swell ambient lembut dari 0:08 hingga 0:10.”

Ini mencerminkan bagaimana Nano Banana mendefinisikan ulang pengalaman editing gambar di 2025. Implikasi untuk craft prompt signifikan: prompt pertama Anda tak perlu sempurna lagi. Hasilkan dasar kuat, lalu kemudikan. Pola itu juga lebih murah secara komputasi dibanding regenerasi terus-menerus.

Lima pola prompt khusus Omni untuk disalin

Paket pembuka pola yang memetakan dengan baik ke kekuatan model:

1. Hero produk

Hasilkan hero shot [durasi] [rasio aspek] dari [produk], [pencahayaan], [gerakan kamera]. Audio: [bed ambient] dengan [suara signature] pada [timecode]. Referensi: [lampirkan foto produk].

2. Reel / Short dengan dialog on-mic

9:16, [durasi]. Subjek menyampaikan baris “[copy pendek]” langsung ke kamera di [setting]. Lip-sync presisi. Ambient latar: [suara lingkungan]. Cocokkan ritme dengan [audio referensi].

3. Cut klip musik

Hasilkan [durasi] [subjek] melakukan [aksi] ke trek musik terlampir. Potong visual pada beat. Pertahankan konsistensi karakter lintas klip. Pencahayaan mengikuti kurva energi trek.

4. Blok bangunan film pendek sinematik

Omni-clip 10 detik: [subjek] [aksi] di [lingkungan]. [Setup pencahayaan] berlanjut. Tahan bed audio lintas cut agar klip ini dapat dirantai dengan klip sebelumnya (terlampir).

5. Edit percakapan

Ambil generasi sebelumnya dan [perubahan spesifik]. Jaga [daftar elemen yang dipertahankan] tak berubah. Konfirmasi perubahan berlaku pada [frame atau timecode spesifik].

Apa yang diuji hari pertama

Saat Anda akhirnya mendapat akses ke Omni, empat tes akan memberi tahu sebagian besar yang perlu diketahui:

Rendering teks di layar — apakah tulisan pada papan tulis atau tanda tetap terbaca melintasi klip penuh?
Lip sync pada dialog terucap — apakah model mendaratkan bentuk mulut di dalam satu generasi?
Kontinuitas multi-klip — rantai dua omni-clip 10 detik dan periksa apakah karakter, pencahayaan, dan bed audio benar-benar bertahan.
Kesetiaan referensi — apakah gambar referensi mengunci identitas karakter, atau hanya menyarankannya?

Jika Omni menyelesaikan tiga dari empat itu, pustaka prompt Anda tiba-tiba lebih berharga daripada tool stack Anda. Rencanakan sesuai.