Live · Ersetzt Veo in der Gemini-App

Gemini Omni
Sprich es, sieh es, teil es — multimodales Video im Chat

Am 19. Mai 2026 stellt Google Gemini Omni auf der I/O-2026-Mainstage vor. Es vereint Geminis Weltverständnis mit nativer multimodaler Generierung (Text, Bild, Video, synchroner Audio) in einer Architektur und ersetzt in der Gemini-App Veo 3.1. Mit Image-to-Video, Video-to-Video-Editing und persönlichem KI-Avatar.

Prompt-Generator öffnen Funktionen ansehen Artikel

Vereintes Modell Synchroner Audio Bearbeitung im Chat

Omni

Text

Image

Video

Audio

5–10s Cliplänge

1080p Max. Auflösung

16:9 · 9:16 · 1:1 Formate

I/O 2026 Erwartete Vorstellung

Offizielle Demos

So sieht der echte Output von Gemini Omni aus

Alle Clips unten sind direkt von der offiziellen Gemini-Omni-Produktseite eingebettet: Text→Video, Image→Video, Style-Transfer, Chat-Editing, Video→Video und KI-Avatar — die gesamte Feature-Oberfläche.

Alle Demo-Videos © Google, hier zur Informationsbündelung genutzt; direkt von storage.googleapis.com/gweb-gemini-cdn gestreamt.

Speak it. See it. Share it.

Offizielles Hero-Video von Gemini Omni: Video per Konversation erstellen, remixen und editieren.

Offizielle Seite öffnen

Text → Video

Mitten in die Story

Ein einziger Text-Prompt erzeugt einen Multi-Shot-Clip mit stimmigem Setting und Kamerasprache.

Bild → Video

Fotos zum Leben erwecken

Lade Referenzbilder hoch, Omni übernimmt die Bewegung und füllt die Timeline automatisch.

Stil · Template

Die Seele der Aufnahme bleibt

Hintergrund, Kostüm oder Stil tauschen — dein Subjekt behält seine Details.

Video → Video

Bestehenden Clip remixen

Bestehende Aufnahme in einen neuen Stil überführen — Licht, Optik oder Material per Prompt umgeschrieben.

Chat-Editing

Einfaches Editieren

Charaktere tauschen, Licht anpassen, Shots stabilisieren — alles im Chat, ohne Neugenerierung.

KI-Avatar

Sei dein eigener Star

KI-Avatar einmal einrichten und in jedem Video auftauchen — ohne Foto-Upload.

Funktionen

Die gesamte Pipeline in einem Modell

Anders als spezialisierte Video-Modelle wie Veo, Sora 2, Seedance 2.0 oder Kling vereint Gemini Omni Sprachverständnis, Bildgenerierung, Videogenerierung und Audio-Synthese in einer Architektur.

Native Multimodal-Ausgabe

Ein Prompt liefert passenden Text, Keyframes und Video — Charaktere, Stil und Licht bleiben über alle Formate konsistent.

Ein Gemini-Stack

Schluss mit dem Verketten spezialisierter Modelle. Text, Bild, Video und Audio teilen sich dieselben Gewichte und denselben langen Kontext.

Synchroner Native-Audio

Ambiente, Score und Dialog richten sich im selben Forward-Pass am Bild aus — Schritte auf dem Beat, Lippen passen ab dem ersten Export.

Direkte Bearbeitung im Chat

Objekte tauschen, Licht ändern, Kamerafahrt anpassen — alles in natürlicher Sprache, ohne Neugenerierung, im Stil von Nano Banana.

Remix und Steuerung

Bestehenden Clip hochladen und per Prompt umsteuern. Referenzbilder, -videos und -audios lassen sich in einem einzigen Befehl kombinieren.

Templates & Stile

Integrierte Templates für Produktwerbung, Reels, Musikvideos und Kurzfilme senken die Einstiegshürde und sichern konsistente Bildsprache.

Specs

Was sich vor der Keynote rekonstruieren lässt

Die Zahlen stammen aus Reddit/X-Leaks und Berichten von TestingCatalog, Programming Insider und OfficeChai.

Dimension	Bekannte Information
Modellfamilie	Google Gemini — Nachfolger-Branding der Veo-Linie
Modell-ID	bard_eac_video_generation_omni / v3smm-lora-prod
Cliplänge	5 / 8 / 10 Sekunden pro Generierung, in der App verkettbar
Auflösung	480p / 720p / 1080p
Seitenverhältnisse	16:9, 9:16, 1:1
Audio	Nativ synthetisiert, in einem Pass synchronisiert
Eingaben	Text / Bild / Video / Audio-Referenzen
Zugriff	In der Gemini-App live für Abonnent:innen (18+) von Google AI Plus / Pro / Ultra
Kontingent	Berichten zufolge verbrauchen zwei Omni-Generierungen ~86 % des AI-Pro-Tageskontingents

Architektur

Drei Produktlinien werden zu einem Omni

Googles generativer Stack war bislang in Veo (Video), Nano Banana / Imagen (Bild) und Gemini (Text) aufgeteilt. Omni führt sie in einer Architektur zusammen.

Vorher

Veo 3.1

Video + nativer Audio

Nano Banana / Imagen

Bildgenerierung und -bearbeitung

Gemini 2.5 / 3.x

Reasoning · langer Kontext

Jetzt · Omni

Gemini Omni

Text · Bild · Video · Audio, ein Modell, ein Prompt

Text Image Video Audio

Use-Cases

Vom Brief zum veröffentlichbaren Content

Ein vereintes Modell mit langem Kontext und synchronem Audio heißt: Ein kohärenter Brief, ein fertiger Schnitt — ohne Tool-Wechsel.

Produktwerbung

Hero-Shots, Packaging-Reveals und Lifestyle-Schnitte mit bereits eingebettetem Ambient-Sound.

Reels & Shorts

Vertikale 9:16-Clips mit On-Mic-Dialog und beat-synchroner Bewegung — perfekt für Social.

Musikvideos

Track referenzieren, Omni schneidet auf den Beat und hält Charaktere über Shots konsistent.

Cinematic Shorts

Mehrere 10-Sekunden-Omni-Clips zu Multi-Shot-Sequenzen verketten — Licht und Audio-Bett bleiben durchgängig.

Landingpage-Hero-Loops

Loopbare 16:9-Atmosphäre für SaaS, Fashion und DTC — gebrandet und stumm lesbar.

Erklärvideos & Tutorials

Skript in narrierte Sequenz mit lippensynchronem Dialog und passendem Ambient-Sound umwandeln.

Vergleich

Wo Omni im Video-Stack 2026 steht

Aggregiert aus Artificial Analysis, Looksy AI, Oimi AI und offiziellen Keynotes — als Orientierung, nicht als Benchmark.

Modell	Anbieter	Architektur	Nativer Audio	Cliplänge
Gemini Omni Omni	Google	Vereinter Omni (Video + Bild + Audio)	In einem Pass synchron	5 / 8 / 10s
Veo 3.1	Google	Spezialisiertes Video-Modell	Ja	~8s
Seedance 2.0	ByteDance	Spezialisiertes multimodales Video	Ja	bis 15s / Shot
Sora 2	OpenAI	Spezialisiertes Video-Modell	Ja	~20s
Kling V3.0	Kuaishou	Spezialisiertes Video-Modell	Eingeschränkt	~10s

Gratis-Zugang

Ist Gemini Omni kostenlos? So nutzt du es 2026 gratis

Gemini Omni Flash ist im kostenlosen Tarif von Google Flow, in YouTube Shorts und der YouTube-Create-App kostenlos. Die eigenständige Gemini-App benötigt Google AI Plus, Pro oder Ultra. Hier sind die offiziellen Einstiege.

labs.google Gratis

Google Flow · Gratis-Tarif + Pläne

Googles KI-Filmstudio. Der kostenlose Tarif enthält Gemini Omni Flash mit Nutzungslimits; für höhere Limits und Profi-Tools auf Plus / Pro / Ultra upgraden.

Öffnen

youtube.com Gratis

YouTube Shorts · Gemini Omni gratis

Erstelle Gemini-Omni-Flash-Clips direkt in Shorts ohne Kosten. Der günstigste offizielle Weg, Omni gratis auszuprobieren.

Öffnen

youtube.com Gratis

YouTube-Create-App · Gratis-Editor

Mobile Editor-App mit eingebautem Gemini Omni Flash. Kein KI-Abo erforderlich.

Öffnen

gemini.google.com Bezahlt

Gemini-App · Plus / Pro / Ultra

Omni in der offiziellen Gemini-App nutzen. Erfordert Google AI Plus, Pro oder Ultra.

Öffnen

So generierst du Gemini-Omni-Videos kostenlos

Schnellster Gratis-Weg: Melde dich bei YouTube Shorts oder in der YouTube-Create-App an, wähle eine Vorlage und nutze die gleichen Multi-Shot-Prompts wie in der Gemini-App.

Entwürfe gratis in YouTube Shorts, um Kameraführung und Pacing festzulegen.
Wechsle erst bei Markenqualität zu Google AI Plus oder Pro.
Statt neu zu generieren lieber im Chat bearbeiten und so bezahlte Credits sparen.

Gratis-Guide lesen Bezahlpläne vergleichen Komplette Preisanalyse lesen Gratis-Prompt-Builder öffnen

Gratis-Kontingente und Preise ändern sich je nach Region und Konto. Aktuelle Infos immer auf den offiziellen Seiten oben prüfen.

Timeline

Vom ersten Leak bis zur I/O-2026-Bühne

Nach öffentlichem Berichtsdatum sortiert, weiterhin in Bewegung.

2026 · 05 · 02
Erstes "Powered by Omni"-String

X-User @Thomas16937378 entdeckt "Start with an idea or try a template. Powered by Omni." im Gemini-Video-Tab.
2026 · 05 · 11
Komplette Preview-Karte in Gemini Mobile

TestingCatalog und Chetaslua zeigen die "Meet our new video model"-Karte, die volle Modell-ID und die 10-Sekunden-Grenze.
2026 · 05 · 12 – 18
Demos verbreiten sich

Ein Clip mit "Professor löst Trigonometrie an der Tafel" zeigt Textkohärenz und physikalische Treue und löst breite Vergleiche mit Veo 3.1 aus.
2026 · 05 · 19
Offizieller Launch auf Google I/O 2026

Google enthüllt Gemini Omni auf der I/O-2026-Mainstage, veröffentlicht die offizielle Produktseite mit Demo-Videos und beginnt, Veo 3.1 in der Gemini-App zu ersetzen.
Ab 2026 · 05 · 19
Rollout von KI-Avatar, Video→Video und Multi-Turn-Editing

Mit dem Launch kommen ein persönlicher KI-Avatar, Video→Video-Editing und chatbasiertes Multi-Turn-Editing — Verfügbarkeit je nach Land und Abostufe.
Nächste Wochen · 2026 · 06+
Entwickler- und Enterprise-API über Gemini API und Vertex AI

Google bestätigte, dass der API-Zugriff für Entwickler und Enterprise-Kunden "in den kommenden Wochen" kommt, ohne festes Datum. Analysten schätzen den Preis auf 0,10–0,30 $ pro Sekunde Videoausgabe.
Auf der Roadmap
Gemini Omni Pro + Bild- und Audioausgaben

Als Nächstes wird ein leistungsfähigeres Omni Pro erwartet, zusammen mit umfangreicheren Audioeingaben über Sprachreferenzen hinaus und Ausgabe-Modalitäten für Bild und Audio – damit wird das Versprechen "jede Eingabe → jede Ausgabe" eingelöst.

FAQ

Die häufigsten Fragen zu Gemini Omni

Was genau ist Gemini Omni?

Es ist Googles kommendes vereintes Multimodal-Modell, das in einer Architektur nativ Text, Bild, Video und synchronen Audio erzeugt — quasi die Verschmelzung von Veo, Imagen und Gemini.

Ist Gemini Omni kostenlos?

Teilweise. Gemini Omni Flash ist im kostenlosen Tarif von Google Flow, in YouTube Shorts und der YouTube-Create-App kostenlos. Für Omni in der eigenständigen Gemini-App ist ein bezahlter Google-AI-Plus-, Pro- oder Ultra-Plan erforderlich.

Wie viel kostet Gemini Omni?

Google AI Plus startet bei rund 7,99 US-Dollar pro Monat, AI Pro ist der gängigste Creator-Tarif, AI Ultra liegt bei etwa 100 US-Dollar pro Monat. Zwei Omni-Flash-Generierungen verbrauchen rund 86 % des Tageskontingents von AI Pro, plane Retries entsprechend. Die Entwickler-API kommt mit eigener Preisstruktur.

Wann erscheint es?

Bereits erschienen. Google hat Gemini Omni am 19. Mai 2026 auf der Google-I/O-2026-Mainstage angekündigt und parallel die offizielle Produktseite samt Demo-Videos veröffentlicht.

In welchem Verhältnis steht es zu Veo 3.1?

Gemini Omni ist der Nachfolger von Veo in der Gemini-App — Google sagt ausdrücklich, dass „Omni Veo in der Gemini-App ersetzen wird“. Video läuft jetzt in derselben Architektur wie Geminis Text und Bild.

Erzeugt es wirklich Sound?

Ja. Ambiente, Score und Dialog werden im selben Pass wie das Video erzeugt — genau dafür steht das "omni" im Namen.

Wie lang dürfen Clips aktuell sein?

Laut offizieller Produktseite bis zu 10 Sekunden pro Clip, mit nativem Audio, bis zu 5 Foto-Referenzen und Multi-Turn-Editing.

Wie wird die Preisstruktur aussehen?

Gemini Omni benötigt ein Google-AI-Plus-, Pro- oder Ultra-Abo und ein Mindestalter von 18 Jahren. Einzelne Features (Avatar, Video→Video-Editing) können je nach Land eingeschränkt sein.

Was ist der KI-Avatar von Gemini Omni?

Eine optionale digitale Version von dir, mit der Gemini Videos erzeugt, die wie du aussehen und klingen — ohne jedes Mal neue Fotos hochzuladen. Nur du selbst kannst deinen Avatar nutzen.

Quellen

Primärberichte und öffentliche Links

Alle Inhalte hier sind aus den unten genannten öffentlichen Quellen aggregiert. Querlesen empfohlen.

blog.google Quelle lesen

Gemini Omni Sprich es, sieh es, teil es — multimodales Video im Chat

Eckdaten

So sieht der echte Output von Gemini Omni aus

Speak it. See it. Share it.

Mitten in die Story

Fotos zum Leben erwecken

Die Seele der Aufnahme bleibt

Bestehenden Clip remixen

Einfaches Editieren

Sei dein eigener Star

Die gesamte Pipeline in einem Modell

Native Multimodal-Ausgabe

Ein Gemini-Stack

Synchroner Native-Audio

Direkte Bearbeitung im Chat

Remix und Steuerung

Templates & Stile

Was sich vor der Keynote rekonstruieren lässt

Drei Produktlinien werden zu einem Omni

Vom Brief zum veröffentlichbaren Content

Produktwerbung

Reels & Shorts

Musikvideos

Cinematic Shorts

Landingpage-Hero-Loops

Erklärvideos & Tutorials

Wo Omni im Video-Stack 2026 steht

Ist Gemini Omni kostenlos? So nutzt du es 2026 gratis

Google Flow · Gratis-Tarif + Pläne

YouTube Shorts · Gemini Omni gratis

YouTube-Create-App · Gratis-Editor

Gemini-App · Plus / Pro / Ultra

So generierst du Gemini-Omni-Videos kostenlos

Vom ersten Leak bis zur I/O-2026-Bühne

Erstes "Powered by Omni"-String

Komplette Preview-Karte in Gemini Mobile

Demos verbreiten sich

Offizieller Launch auf Google I/O 2026

Rollout von KI-Avatar, Video→Video und Multi-Turn-Editing

Entwickler- und Enterprise-API über Gemini API und Vertex AI

Gemini Omni Pro + Bild- und Audioausgaben

Die häufigsten Fragen zu Gemini Omni

Primärberichte und öffentliche Links

Google Blog · Vorstellung von Gemini Omni

Google Blog · 100 Dinge von Google I/O 2026

Google · Offizielle Gemini-Omni-Seite

DataCamp · Google I/O 2026 Deep Dive

TestingCatalog · Programming Insider

OfficeChai · Gemini Omni Spotted

Looksy AI · Gemini Omni Produktseite

Gemini 2.5 Technical Report

Gemini Omni
Sprich es, sieh es, teil es — multimodales Video im Chat