Diterbitkan pada 16 Mei 2026 8 min baca

Bagaimana Menulis Prompt untuk Gemini Omni pada 2026: Panduan Praktikal Prompt AI Video Multimodal

Sebuah rangka prompt 2026 untuk model Gemini Omni bocor milik Google. Persona, task, format, context — campur kamera, audio dan aset rujukan — semua dalam satu brief.

Gemini OmniKejuruteraan PromptAI VideoAmalan Terbaik2026

Mengapa menulis prompt untuk Omni berbeza

Kebanyakan prompt AI video yang ditulis dalam 2024–2025 direka untuk model video khusus berkonteks pendek. Anda menulis satu ayat, memilih preset gaya, menekan generate. Dengan Gemini Omni — model multimodal bersatu bocor milik Google — prompt melakukan kerja yang jauh lebih banyak. Prompt tunggal yang sama mengarahkan teks, imej, video dan audio tersegerak dalam satu tetingkap konteks panjang.

Itu mengalihkan prompt daripada “huraikan adegan” kepada “huraikan keseluruhan deliverable.” Panduan ini adalah rangka kerja untuk mendapatkan hasil maksimum daripada Omni apabila ia mendarat, dengan teknik dipinjam dari panduan prompt rasmi Google dan kad pratonton Omni bocor.

Rangka empat-bahagian: Persona · Task · Format · Context

Playbook prompt Google yang lebih luas untuk keluarga Gemini mengesyorkan empat blok pembinaan:

Persona — kepakaran yang anda mahu model tarik (“bertindak sebagai sinematografer”, “sebagai pereka jenama”, “sebagai penyunting dokumentari”).
Task — apa yang anda mahu dihasilkan (“hero shot 10 saat fon kepala baharu”, “product reveal 9:16”).
Format — kekangan struktur (“16:9, 1080p, tracking shot perlahan, pencahayaan golden-hour”).
Context — jenama, audiens dan bahan rujukan yang model harus tarik daripadanya.

Untuk Omni, ini memetakan terus ke struktur brief bersih:

Anda adalah [PERSONA].
Jana [TASK].
Format: [nisbah aspek, tempoh, resolusi, bahasa kamera, pencahayaan].
Context: [suara jenama, audiens, rujukan, isyarat audio].

Contoh sebenar:

Anda adalah sinematografer mewah ala Wong Kar-wai. Jana hero shot 10 saat fon kepala wireless hitam matt yang terletak di atas alas konkrit bertekstur. Format: 16:9, 1080p, tracking shot 35mm perlahan dari kiri-kamera ke kanan-kamera, back-light golden-hour lembut, depth of field cetek. Context: jenama ialah audio premium Skandinavia minimalis. Audio: drone atmosfera rendah dengan satu pukulan loceng halus pada 0:07 ketika kamera melepasi tanda jenama. Imej rujukan: lihat foto produk dilampirkan untuk warna dan jahitan tepat.

Tiga C: Concise, Clear, Consistent

Panduan rujukan prompt Google sendiri menekankan tiga prinsip yang diterjemah bersih ke Omni:

Concise. Panjang tidak sama dengan baik. Buang kata pengisi. Kekalkan satu subjek utama dan satu tindakan utama setiap prompt.
Clear. Elakkan deskriptor kabur seperti “buat lebih baik” atau “lebih sinematik.” Gantikan dengan arahan konkrit: “tingkatkan depth of field”, “suhu warna lebih panas”, “pergerakan kamera lebih perlahan pada kelajuan 0.5x.”
Consistent. Gunakan kosa kata yang sama untuk konsep yang sama merentas lelaran. Jika anda memanggilnya “tracking shot” sekali, jangan beralih ke “dolly move” kemudian — model menganggapnya sebagai isyarat berbeza.

Manfaatkan prompt berlapis, konteks panjang

Tidak seperti model video konteks pendek, Omni mewarisi tetingkap konteks panjang Gemini. Itu bermakna anda boleh — dan patut — menulis prompt berlapis, deskriptif. Brief produktif merangkumi:

Subjek: siapa atau apa dalam bingkai, termasuk rujukan mengunci identiti.
Mood: daftar emosi dan rentak.
Kamera: kanta, pergerakan, perubahan bingkai dalam klip.
Pencahayaan: sumber, arah, suhu warna, kontras.
Dialog: sebarang baris yang dilafazkan, dengan masa lip-sync jika relevan.
Reka bentuk bunyi: bed ambien, genre muzik, isyarat bunyi utama dengan timecode.
Konteks jenama atau gaya: rujukan ke karya sedia ada atau bahasa visual.

Anda pada asasnya sedang menulis treatment satu halaman, bukan satu ayat. Konteks panjang Omni dibina untuk ini.

Bersandar pada aset rujukan dengan agresif

Senarai ciri Omni yang bocor secara terang-terangan menonjolkan input rujukan: imej, klip video dan trek audio semuanya boleh digabung dalam satu arahan. Penggunaan konkrit:

Character lock: lampirkan imej rujukan protagonis untuk memastikan mereka konsisten merentas berbilang omni-clip.
Style lock: lampirkan satu bingkai dari karya sedia ada untuk menambat color grade dan komposisi.
Motion lock: lampirkan video rujukan pendek untuk meniru pergerakan kamera atau aksi watak.
Beat lock: lampirkan trek muzik dan minta Omni memotong visual ke rentak (sangat berguna untuk Reels dan video muzik).

Aset rujukan membawa lebih banyak isyarat setiap bait berbanding teks sahaja. Prompt 30 patah perkataan dengan tiga imej rujukan hampir selalu mengatasi prompt 300 patah perkataan tanpa rujukan.

Sunting dalam chat dan bukan menjana semula

Pergeseran aliran kerja tunggal terbesar yang Omni dikhabarkan memperkenalkan adalah penyuntingan terus dalam chat. Daripada menjana semula seluruh klip apabila satu elemen salah, anda boleh meminta:

“Tukar jam tangan pada pergelangan model kepada chronograph perak berus. Kekalkan semua bingkai, pencahayaan dan audio lain sama persis.”

“Perlahankan pergerakan kamera sebanyak 30% dan panaskan suhu warna sebanyak 200 K.”

“Keluarkan pukulan loceng pada 0:07 dan tambah satu swell ambien lembut dari 0:08 hingga 0:10.”

Ini mencerminkan bagaimana Nano Banana mentakrifkan semula pengalaman penyuntingan imej dalam 2025. Implikasi untuk kraf prompt adalah signifikan: prompt pertama anda tidak perlu sempurna lagi. Jana asas kuat, kemudian kendalikan. Corak itu juga lebih murah dari segi pengiraan berbanding penjanaan semula berterusan.

Lima corak prompt khusus Omni untuk disalin

Sekumpulan corak permulaan yang memetakan baik ke kekuatan model:

1. Hero produk

Jana hero shot [tempoh] [nisbah aspek] bagi [produk], [pencahayaan], [pergerakan kamera]. Audio: [bed ambien] dengan [bunyi tandatangan] pada [timecode]. Rujukan: [lampirkan foto produk].

2. Reel / Short dengan dialog on-mic

9:16, [tempoh]. Subjek menyampaikan baris “[copy pendek]” terus ke kamera dalam [latar]. Lip-sync tepat. Ambien latar: [bunyi persekitaran]. Padankan rentak dengan [audio rujukan].

3. Potongan video muzik

Jana [tempoh] [subjek] melakukan [aksi] kepada trek muzik dilampirkan. Potong visual pada rentak. Kekalkan konsistensi watak merentas klip. Pencahayaan mengikuti lengkung tenaga trek.

4. Blok pembinaan filem pendek sinematik

Omni-clip 10 saat: [subjek] [aksi] dalam [persekitaran]. [Setup pencahayaan] berterusan. Tahan bed audio merentas pemotongan supaya klip ini boleh dirantai dengan klip sebelumnya (dilampirkan).

5. Suntingan perbualan

Ambil penjanaan sebelumnya dan [perubahan khusus]. Kekalkan [senarai elemen yang dipelihara] tidak berubah. Sahkan perubahan berkesan pada [bingkai atau timecode khusus].

Apa yang perlu diuji pada hari pertama

Apabila anda akhirnya boleh menyentuh Omni, empat ujian akan memberitahu anda kebanyakan apa yang perlu diketahui:

Pemaparan teks di skrin — adakah tulisan pada papan hitam atau papan tanda kekal boleh dibaca merentas keseluruhan klip?
Lip sync pada dialog yang dilafazkan — adakah model mendaratkan bentuk mulut dalam satu penjanaan?
Keterusan berbilang klip — rantai dua omni-clip 10 saat dan periksa bahawa watak, pencahayaan dan bed audio benar-benar berterusan.
Kesetiaan rujukan — adakah imej rujukan mengunci identiti watak, atau hanya mencadangkannya?

Jika Omni menyelesaikan tiga daripada empat itu, pustaka prompt anda tiba-tiba lebih bernilai daripada tool stack anda. Rancang dengan sewajarnya.