Hoe Gemini Omni prompten in 2026: praktische gids voor multimodale AI-videoprompts
Een 2026-promptframework voor Google's Gemini Omni-model. Persona, taak, formaat, context — plus camera, audio en referentie-assets — allemaal in één briefing.
Waarom Omni-prompting anders is
De meeste AI-videoprompts geschreven in 2024–2025 waren ontworpen voor gespecialiseerde korte-context videomodellen. Je schreef één zin, koos een stijl-preset, drukte op genereren. Met Gemini Omni — Google’s uniforme multimodale model — doet de prompt veel meer werk. Dezelfde enkele prompt stuurt tekst, beeld, video en gesynchroniseerde audio binnen een lang contextvenster.
Dat verschuift de prompt van “beschrijf de scène” naar “beschrijf de hele oplevering”. Deze gids is een werkend framework om het meest uit Omni te halen zodra het landt, met technieken geleend uit Google’s officiële prompting-handleiding en de gelekte Omni-voorbeeldkaarten.
Het vier-delen framework: Persona · Taak · Formaat · Context
Google’s bredere prompting-playbook voor de Gemini-familie beveelt vier bouwstenen aan:
- Persona — de expertise waaruit je wilt dat het model put (“doe alsof je cinematograaf bent”, “als merkdesigner”, “als documentaire-editor”).
- Taak — wat je wilt produceren (“een hero shot van 10 seconden van de nieuwe koptelefoon”, “een 9:16 product-reveal”).
- Formaat — de structurele beperkingen (“16:9, 1080p, slow tracking shot, golden-hour belichting”).
- Context — het merk, publiek en referentiemateriaal waaruit het model moet putten.
Voor Omni mapt dit direct op een schone briefingstructuur:
Je bent [PERSONA].
Genereer [TAAK].
Formaat: [beeldverhouding, duur, resolutie, cameralingo, belichting].
Context: [merkstem, publiek, referenties, audio-cues].
Een echt voorbeeld:
Je bent een luxe cinematograaf in de stijl van Wong Kar-wai. Genereer een hero shot van 10 seconden van een matzwarte draadloze koptelefoon op een getextureerde betonnen plint. Formaat: 16:9, 1080p, langzame 35mm tracking shot van links naar rechts, zacht golden-hour backlight, ondiepe scherptediepte. Context: merk is minimalistisch Scandinavisch premium-audio. Audio: lage atmosferische drone met één subtiele belslag op 0:07 wanneer de camera het merkteken passeert. Referentiebeeld: zie bijgevoegde productfoto voor exacte kleur en stiksel.
De drie K’s: Kort, Klaar, Consistent
Google’s eigen prompting-referentiegids benadrukt drie principes die schoon vertalen naar Omni:
- Kort. Lang is niet gelijk aan goed. Strip vulwoorden. Houd één hoofdsubject en één hoofdactie per prompt.
- Klaar (helder). Vermijd dubbelzinnige beschrijvers zoals “maak het beter” of “filmischer”. Vervang door concrete instructies: “verhoog scherptediepte”, “warmere kleurtemperatuur”, “langzamere camerabeweging op 0,5×”.
- Consistent. Gebruik dezelfde woordenschat voor dezelfde concepten over iteraties heen. Als je het één keer “tracking shot” noemt, schakel later niet over op “dolly move” — het model behandelt die als verschillende signalen.
Leun op lange-context, gelaagde prompts
Anders dan korte-context videomodellen erft Omni Gemini’s lange contextvenster. Dat betekent dat je gelaagde, beschrijvende prompts kunt — en moet — schrijven. Een productieve briefing dekt:
- Subject: wie of wat in beeld is, inclusief identity-lock-referenties.
- Mood: emotioneel register en ritme.
- Camera: lens, beweging, kadrering-wijzigingen binnen de clip.
- Belichting: bron, richting, kleurtemperatuur, contrast.
- Dialoog: alle gesproken regels, met lip-sync timing indien relevant.
- Sound design: ambient bed, muziek-genre, sleutel-geluidscues met timecodes.
- Merk- of stilistische context: verwijzingen naar bestaand werk of visuele taal.
Je schrijft in wezen een treatment van één pagina, geen zin. Omni’s lange context is hiervoor gebouwd.
Gebruik referentie-assets agressief
De gelekte Omni-feature-lijst benadrukt expliciet referentie-inputs: beelden, videoclips en audiotracks kunnen allemaal in één instructie gecombineerd worden. Concrete gebruiksgevallen:
- Karakter-lock: voeg een referentiebeeld van de hoofdrolspeler toe om consistent te blijven over meerdere omni-clips.
- Stijl-lock: voeg een frame uit een bestaand werk toe om color grade en compositie te verankeren.
- Beweging-lock: voeg een korte referentievideo toe om een camerabeweging of karakter-actie na te bootsen.
- Beat-lock: voeg een muziektrack toe en vraag Omni om visuals op de beat te knippen (vooral nuttig voor Reels en muziekvideo’s).
Referentie-assets dragen veel meer signaal per byte dan alleen tekst. Een 30-woorden prompt met drie referentiebeelden zal bijna altijd een 300-woorden prompt zonder referenties verslaan.
Bewerk in chat in plaats van te regenereren
De grootste workflow-verschuiving die Omni zou introduceren is directe in-chat bewerking. In plaats van een hele clip te regenereren als één element fout is, kun je vragen:
“Vervang het horloge aan de pols van het model door een geborstelde zilveren chronograaf. Houd alle andere kadrering, belichting en audio exact hetzelfde.”
“Vertraag de camerabeweging met 30 % en maak de kleurtemperatuur 200 K warmer.”
“Verwijder de belslag op 0:07 en voeg in plaats daarvan een zachte ambient swell toe van 0:08 tot 0:10.”
Dit weerspiegelt hoe Nano Banana de beeldbewerkingservaring in 2025 herdefinieerde. De implicatie voor prompt-craft is significant: je eerste prompt hoeft niet meer perfect te zijn. Genereer een sterke basis, stuur hem dan. Dat patroon is ook goedkoper in compute-termen dan constante regeneratie.
Vijf Omni-specifieke prompt-patronen om te kopiëren
Een starter pack van patronen die goed mappen op de sterke punten van het model:
1. Producthero
Genereer een hero shot [duur] [beeldverhouding] van [product], [belichting], [camerabeweging]. Audio: [ambient] met [signature geluid] op [timecode]. Referentie: [productfoto bijvoegen].
2. Reel / Short met dialoog op microfoon
9:16, [duur]. Subject levert de regel “[korte copy]” direct in camera in een [setting]. Precieze lip-sync. Achtergrond-ambient: [omgevingsgeluid]. Match het ritme van [referentie-audio].
3. Muziekvideo-cut
Genereer [duur] van [subject] dat [actie] uitvoert op de bijgevoegde muziektrack. Knip visuals op de beat. Behoud karakter-consistentie over de clip. Belichting volgt de energie-curve van de track.
4. Cinematische short-bouwsteen
Omni-clip 10 seconden: [subject] [actie] in [omgeving]. Continue [belichtings-setup]. Houd de ambient audio over de cut zodat deze clip geketend kan worden met de vorige (bijgevoegd).
5. Conversationele bewerking
Neem de vorige generatie en [specifieke wijziging]. Houd [lijst van behouden elementen] ongewijzigd. Bevestig dat de wijziging effect had op [specifiek frame of timecode].
Wat te testen op dag één
Wanneer je eindelijk Omni in handen krijgt, vertellen vier tests je het meeste van wat je moet weten:
- Tekst-rendering op het scherm — blijft schrift op een schoolbord of bord leesbaar over de hele clip?
- Lip-sync op gesproken dialoog — landt het model mondvormen binnen één generatie?
- Multi-clip continuïteit — keten twee 10-seconden omni-clips en check of personages, belichting en ambient audio echt blijven bestaan.
- Referentie-trouw — vergrendelt een referentiebeeld karakteridentiteit, of suggereert het alleen?
Als Omni drie van die vier raakt, is je promptbibliotheek opeens meer waard dan je tool-stack. Plan daarop.