Gemini Omni
Terug naar alle artikelen
9 min leestijd

Wat is Gemini Omni? Een complete 2026-gids over Google's aankomende uniforme AI-model

Gemini Omni is Google's gemunkelde uniforme multimodale model dat nativ tekst, beeld, video en gesynchroniseerde audio genereert. Alles wat we weten vóór Google I/O 2026.

Gemini OmniGoogle AIMultimodalVideo GenerationGoogle I/O 20262026

Een nieuwe productcategorie, gelekt vóór launch

Het grootste deel van 2024 en 2025 was Google’s generatieve stack feitelijk drie verschillende producten die aan elkaar geplakt waren: Veo voor video, Imagen (en later Nano Banana) voor beeld, en Gemini voor tekst en redeneren. Die splitsing was een sterkte zolang elk model eigen trainingscycli nodig had, maar dwong creators om tools handmatig te ketenen en gaf Google een gefragmenteerd verhaal in concurrentie met OpenAI’s Sora en ByteDance’s Seedance.

Begin mei 2026 veranderde één UI-string het gesprek. Een X-gebruiker spotte de regel “Start with an idea or try a template. Powered by Omni.” in Gemini’s videotabblad. Binnen dagen bevestigden TestingCatalog, Programming Insider en OfficeChai een vervolg-voorbeeldkaart op Gemini Mobile met de tekst “Meet our new video model. Remix your videos, edit directly in chat, try a template, and more.” Dat model heet Gemini Omni, en de naam zelf is de hele pitch.

Wat Gemini Omni eigenlijk is

Gemini Omni is Google’s gemunkelde uniforme multimodale model: één architectuur die tekst, beeld, video en gesynchroniseerde audio uit één prompt genereert. Drie theorieën over de werkelijke aard zijn opgekomen in de leak-dekking:

  1. Een rebrand van Veo. Google zou simpelweg het consumentenmerk Veo kunnen afschaffen ten gunste van “Omni”, zoals beeldgeneratie werd geconsolideerd onder Nano Banana.
  2. Een nieuw Gemini-natief videomodel. Een versie van Gemini specifiek fijn-getuned voor video, die de Veo-modelfamilie verdringt naast tekst- en beeldvarianten.
  3. Een waar omni-model. Een enkel Gemini-getraind systeem dat nativ tekst, beelden, video en audio produceert binnen één set gewichten en één lang contextvenster.

De gelekte model-ID — bard_eac_video_generation_omni / v3smm-lora-prod — en de consistente framing in de leaks wijzen naar deur #3. Dat zou Gemini Omni het eerste top-tier omni-model met natieve video-output van een grote AI-provider maken, en een betekenisvolle stap voorbij wat Sora 2, Seedance 2.0 of Kling V3.0 vandaag kunnen.

De signalen die echt lijken

Door de rapportage van de afgelopen drie weken is een coherent beeld ontstaan:

  • Cliplengte: 5 / 8 / 10 seconden per generatie. Multi-clip-ketening wordt op clientlaag binnen de Gemini-app afgehandeld.
  • Resolutie: tot 1080p, in 16:9, 9:16 en 1:1 verhoudingen.
  • Gesynchroniseerde natieve audio. Omgevingsgeluid, muziek en dialoog worden in dezelfde forward pass met het beeld uitgelijnd.
  • Bewerken in chat. Een object vervangen, verlichting wijzigen of een camera-beweging aanpassen met natuurlijke taal — geen volledige regeneratie.
  • Remix en templates. Upload een bestaande clip en stuur hem bij met prompts; leun op kant-en-klare templates voor ads, Reels, muziekvideo’s en cinematische shorts.
  • Prijssignaal. Een Reddit-screenshot toonde twee Omni-generaties die ~86 % van een AI Pro-dagquota verbrandden, wat ofwel een hogere tier (Ultra / Pro Plus) of per-generatie API-billing suggereert.

De gelekte demo’s die veel van de hype voedden — inclusief een “hoogleraar lost trigonometrie op het schoolbord op”-clip met leesbare handgeschreven tekst — wijzen op veel strakkere prompt-aanhankelijkheid en fysische trouw dan Veo 3.1 momenteel levert.

Hoe Omni in Google’s stack past

Het mentale model dat het best bij de leaks past, is dit:

Voorheen:  Gemini (tekst)  +  Nano Banana / Imagen (beeld)  +  Veo 3.1 (video)
                  ↓                       ↓                            ↓
                  └────────────  handmatige ketening  ─────────────────┘

Nu:        Gemini Omni
           ├── tekst
           ├── beeld
           ├── video
           └── audio       (één model · één prompt · één contextvenster)

Voor ontwikkelaars is de belangrijkste consequentie dat Veo 3.1 morgen niet weggaat. Veo 3.1 heeft al gedocumenteerde API-toegang in Gemini API en Vertex AI, met functies als referentiebeeld-begeleiding (tot drie referenties), scène-uitbreiding tot één minuut, eerste-en-laatste-frame-overgangen, en natieve conversatie-audio. Omni erft die engineering en voegt de uniforme architectuur erbovenop. Tot Google formele Omni-documentatie publiceert, blijft Veo 3.1 de stabiele baseline voor productiewerk.

Waarom dit voor creators belangrijk is

Een uniform omni-model laat wat ooit een multi-app-pijplijn was instorten tot één briefing. Concreet:

  • Een productteam kan één beschrijving schrijven — subject, sfeer, camera-beweging, verlichting, dialoog, omgevingsgeluid — en weggaan met een afgewerkte cut in plaats van te naaien tussen Midjourney, Veo en een aparte audiotool.
  • Karakter- en stijlconsistentie verbeteren drastisch omdat hetzelfde model elke modaliteit produceert.
  • De kostenstructuur kan voorspelbaarder worden: één model om te factureren, één set veiligheidsregels, één bewerk-interface.

Voor bureaus en kleine studio’s is de praktische vraag niet langer “welke tool is het beste per modaliteit”, maar “hoe snel kunnen we onze pijplijn rond één multimodaal model herstructureren?”

Wat te bekijken op Google I/O 2026

Google I/O 2026 loopt 19–20 mei. Op basis van pre-keynote leaks omvat de realistische boodschappenlijst voor de keynote:

  • Officiële Gemini Omni-onthulling, waarschijnlijk met live demo en tier-aankondiging (Flash vs Pro).
  • API-beschikbaarheid via Gemini API en AI Studio, mogelijk met een agent-stijl interface vergelijkbaar met Deep Research.
  • Een Gemini 3.5- of 4.0-onthulling, gericht op snelheid en een nieuwe langetermijngeheugen-functie met codenaam “Teamfood”.
  • Nieuwe Gemini Live-spraakmodellen (gemunkelde codenamen “Capybara” en “Nitrogen”).
  • Een potentiële Veo 4-update met YouTube-integratie, ingezet als ontwikkelaar-georiënteerd videoverhaal naast het consumentgerichte Omni.
  • Abonnement-herstructurering — duidelijkere Advance- / Pro- / Ultra-tiers die passen bij de zwaardere compute-voetafdruk van Omni.

Als zelfs de helft hiervan landt, wordt Gemini Omni de meest consequente AI-modellaunch van halverwege 2026 — en het moment waarop Google overgaat van een federatie van gespecialiseerde modellen naar één uniforme multimodale stack.

Conclusie

Gemini Omni is niet officieel aangekondigd, maar het spoor van UI-strings, model-ID’s en werkende voorbeeldkaarten wijst op een launch binnen dagen. Als het echt een waar omni-model is, betreedt de AI-video-categorie een nieuwe fase: single-prompt, single-model, single-contextvenster productie van tekst, beeld, video en audio. Voor iedereen die generatieve AI in 2026 volgt, is dit de release om in de gaten te houden.