Lanzamiento oficial · Reemplaza a Veo en la app Gemini

Gemini Omni
Habla, mira, comparte — vídeo multimodal en una conversación

El 19 de mayo de 2026, Google presentó oficialmente Gemini Omni en el escenario principal de I/O 2026. Combina la comprensión del mundo de Gemini con generación multimodal nativa (texto, imagen, vídeo y audio sincronizado) en una sola arquitectura, reemplazando a Veo 3.1 dentro de la app Gemini. Incluye imagen→vídeo, edición de vídeo a vídeo y avatar de IA personal.

Abrir el generador de prompts Ver capacidades Artículos

Modelo unificado Audio sincronizado Edición en chat

Omni

Text

Image

Video

Audio

5–10s Duración del clip

1080p Resolución máx.

16:9 · 9:16 · 1:1 Formatos

I/O 2026 Presentación prevista

Demos oficiales

Mira lo que realmente produce Gemini Omni

Todos los clips siguientes están incrustados directamente desde la página oficial de Gemini Omni: texto→vídeo, imagen→vídeo, transferencia de estilo, edición en chat, vídeo→vídeo y avatar de IA — toda la superficie de capacidades.

Todos los vídeos demo son © Google, usados aquí con fines informativos; se transmiten directamente desde storage.googleapis.com/gweb-gemini-cdn.

Speak it. See it. Share it.

Vídeo hero oficial de Gemini Omni: crear, remezclar y editar vídeo conversando.

Ver la página oficial

Texto → vídeo

Entra en la historia

Un prompt de texto produce un clip multi-plano con entorno y lenguaje de cámara coherentes.

Imagen → vídeo

Da vida a tus fotos

Sube imágenes de referencia y Omni anima el movimiento, llenando la línea de tiempo.

Estilo · plantilla

Conserva el alma del plano

Cambia fondos, vestuario o estilo — el sujeto mantiene sus detalles.

Vídeo → vídeo

Remezcla un clip existente

Reformula una toma en un nuevo estilo — iluminación, lente o incluso el material se reescriben con un prompt.

Edición en chat

Edición fácil

Reemplaza personajes, ajusta la iluminación o estabiliza la toma — todo conversando, sin regenerar.

Avatar de IA

Sé la estrella

Configura una vez tu avatar de IA y aparece en cada vídeo sin volver a subir fotos.

Capacidades

Toda la cadena creativa en un solo modelo

A diferencia de modelos especializados como Veo, Sora 2, Seedance 2.0 o Kling, Gemini Omni mantiene razonamiento de lenguaje, generación de imagen, generación de vídeo y síntesis de audio bajo una sola arquitectura.

Salida multimodal nativa

Un único prompt produce texto, fotogramas clave y vídeo que coinciden, con personajes, estilo e iluminación coherentes entre formatos.

Una pila Gemini unificada

Se acabó encadenar modelos especializados. Texto, imagen, vídeo y audio comparten los mismos pesos y el mismo contexto extenso.

Audio nativo sincronizado

Sonido ambiente, banda sonora y diálogo se alinean con la imagen en la misma pasada — pasos en el beat, labios sincronizados desde la primera exportación.

Edición directa en el chat

Cambia un objeto, modifica la iluminación o ajusta un movimiento de cámara en lenguaje natural — sin regenerar, siguiendo el guion de Nano Banana.

Remezcla y dirige

Sube un clip existente y redirígelo con prompts. Imágenes, vídeos y audios de referencia se combinan en una sola instrucción.

Plantillas y estilos

Plantillas integradas para anuncios, Reels, videoclips y cortos cinematográficos reducen la barrera y mantienen un lenguaje de cámara coherente.

Especificaciones

Lo que se sabe antes del keynote

Las cifras se agregan de filtraciones en Reddit/X y reportes de TestingCatalog, Programming Insider y OfficeChai.

Dimensión	Información conocida
Familia	Google Gemini — sucesor de la línea Veo
ID del modelo	bard_eac_video_generation_omni / v3smm-lora-prod
Duración del clip	5 / 8 / 10 segundos por generación, encadenable en la app
Resolución	480p / 720p / 1080p
Formatos	16:9, 9:16, 1:1
Audio	Sintetizado de forma nativa, sincronizado en una sola pasada
Entradas	Texto / imagen / vídeo / audio de referencia
Acceso	Disponible en la app Gemini para suscriptores 18+ de Google AI Plus / Pro / Ultra
Cuota	Informes indican que dos generaciones consumen ~86 % de la cuota diaria de AI Pro

Arquitectura

Tres líneas de producto fusionadas en un Omni

La pila generativa de Google solía estar dividida en Veo (vídeo), Nano Banana / Imagen (imagen) y Gemini (texto). Omni las unifica en una sola arquitectura.

Antes

Veo 3.1

Vídeo + audio nativo

Nano Banana / Imagen

Generación y edición de imagen

Gemini 2.5 / 3.x

Razonamiento · contexto largo

Ahora · Omni

Gemini Omni

Texto · imagen · vídeo · audio, un modelo, un prompt

Text Image Video Audio

Casos de uso

De un brief a contenido publicable

Un modelo unificado con contexto largo y audio sincronizado permite escribir un brief coherente y obtener un corte final.

Anuncios de producto

Planos hero, revelaciones de packaging y cortes lifestyle con sonido ambiente ya bloqueado.

Reels y Shorts

Clips 9:16 con diálogo on-mic y movimiento sincronizado al ritmo, ideales para social.

Videoclips

Referencia una pista y Omni corta visuales al ritmo, con personajes consistentes entre planos.

Cortos cinematográficos

Encadena varios omni-clips de 10 s en secuencias multi-plano con iluminación y audio continuos.

Hero loops de landing

Clips 16:9 atmosféricos en bucle para SaaS, moda y DTC — branded y legibles en mute.

Explicativos y tutoriales

Convierte un guion en una secuencia narrada con diálogo sincronizado y sonido ambiente acorde.

Comparar

Dónde encaja Omni en el ecosistema de vídeo 2026

Agregado de Artificial Analysis, Looksy AI, Oimi AI y keynotes oficiales — orientativo, no benchmarks.

Modelo	Fabricante	Arquitectura	Audio nativo	Duración
Gemini Omni Omni	Google	Omni unificado (vídeo + imagen + audio)	Sincronizado en una pasada	5 / 8 / 10s
Veo 3.1	Google	Modelo de vídeo especializado	Sí	~8s
Seedance 2.0	ByteDance	Vídeo multimodal especializado	Sí	hasta 15s / plano
Sora 2	OpenAI	Modelo de vídeo especializado	Sí	~20s
Kling V3.0	Kuaishou	Modelo de vídeo especializado	Limitado	~10s

Acceso gratis

¿Gemini Omni es gratis? Cómo usarlo gratis en 2026

Gemini Omni Flash es gratis en la capa gratuita de Google Flow, en YouTube Shorts y en la app YouTube Create. La app independiente de Gemini necesita Google AI Plus, Pro o Ultra. Abre los accesos oficiales abajo.

labs.google Gratis

Google Flow · Capa gratuita + planes

El estudio de cine con IA de Google. La capa gratuita incluye Gemini Omni Flash con límites de uso; sube a Plus / Pro / Ultra para más límites y herramientas pro.

Abrir

youtube.com Gratis

YouTube Shorts · Gemini Omni gratis

Genera clips de Gemini Omni Flash dentro de Shorts sin coste. La forma oficial más barata de probar Omni gratis.

Abrir

youtube.com Gratis

App YouTube Create · Editor móvil gratis

Editor móvil con Gemini Omni Flash integrado. No se necesita suscripción de IA.

Abrir

gemini.google.com De pago

App Gemini · Plus / Pro / Ultra

Usa Omni dentro de la app oficial de Gemini. Requiere un plan de Google AI Plus, Pro o Ultra.

Abrir

Cómo generar vídeos de Gemini Omni gratis

Ruta gratis más rápida: inicia sesión en YouTube Shorts o la app YouTube Create, elige una plantilla y usa los mismos prompts multi-toma que en la app Gemini.

Borradores gratis en YouTube Shorts para fijar lenguaje de cámara y ritmo.
Pasa al plan Google AI Plus o Pro solo cuando necesites calidad de marca.
Usa la edición conversacional en vez de regenerar para estirar cada crédito de pago.

Leer la guía gratis Comparar planes de pago Leer el desglose de precios Abrir el prompt builder gratis

Las cuotas gratis y los precios cambian según región y cuenta. Comprueba siempre los accesos oficiales arriba.

Cronología

De la primera filtración al escenario de I/O 2026

Ordenado por fecha de reporte público, en evolución.

2026 · 05 · 02
Primer string "Powered by Omni"

El usuario de X @Thomas16937378 detectó "Start with an idea or try a template. Powered by Omni." en la pestaña de vídeo de Gemini.
2026 · 05 · 11
Tarjeta de preview en Gemini móvil

TestingCatalog y Chetaslua revelaron la tarjeta "Meet our new video model", el ID completo y el límite de 10 segundos.
2026 · 05 · 12 – 18
Las demos se viralizan

Un clip de "profesor resolviendo trigonometría en una pizarra" mostró coherencia textual y fidelidad física, disparando comparativas con Veo 3.1.
2026 · 05 · 19
Lanzamiento oficial en Google I/O 2026

Google presenta Gemini Omni en el escenario principal de I/O 2026, publica la página de producto oficial con vídeos demo y comienza a reemplazar a Veo 3.1 en la app Gemini.
2026 · 05 · 19 en adelante
Despliegue de avatar de IA, vídeo→vídeo y edición multi-turno

El lanzamiento incluye un avatar de IA personal, edición vídeo a vídeo y edición multi-turno tipo chat — el rollout depende de país y nivel de suscripción.
Próximas semanas · 2026 · 06+
API para desarrolladores y empresas vía Gemini API y Vertex AI

Google confirmó que el acceso por API para desarrolladores y clientes empresariales llegará "en las próximas semanas" sin fecha firme. Analistas estiman entre 0,10 y 0,30 USD por segundo de vídeo generado.
En la hoja de ruta
Gemini Omni Pro + salidas de imagen y audio

Se espera a continuación un Omni Pro más capaz, junto a entradas de audio más ricas (más allá de las referencias de voz) y modalidades de salida en imagen y audio, completando la promesa de "cualquier entrada → cualquier salida".

Preguntas frecuentes

Lo que más se pregunta sobre Gemini Omni

¿Qué es exactamente Gemini Omni?

Es el próximo modelo multimodal unificado de Google que genera de forma nativa texto, imagen, vídeo y audio sincronizado dentro de una sola arquitectura — efectivamente fusionando Veo, Imagen y Gemini.

¿Gemini Omni es gratis?

Parcialmente. Gemini Omni Flash es gratis en la capa gratuita de Google Flow, en YouTube Shorts y en la app YouTube Create. Para usar Omni dentro de la app independiente de Gemini se necesita un plan de pago Google AI Plus, Pro o Ultra.

¿Cuánto cuesta Gemini Omni?

Google AI Plus empieza en torno a 7,99 USD/mes, AI Pro es el plan más habitual para creadores y AI Ultra ronda los 100 USD/mes. Dos generaciones de Omni Flash consumen alrededor del 86% de la cuota diaria de AI Pro, así que planifica los reintentos. La API para desarrolladores llegará con su propio precio.

¿Cuándo se lanzará?

Ya está disponible. Google anunció Gemini Omni en el escenario principal de Google I/O 2026 el 19 de mayo de 2026, publicando simultáneamente la página de producto oficial y los vídeos demo.

¿Cómo se relaciona con Veo 3.1?

Gemini Omni es el sucesor de Veo dentro de la app Gemini — Google indica explícitamente que "Omni reemplazará a Veo en la app Gemini". El vídeo se integra ahora en la misma arquitectura que el texto y la imagen de Gemini.

¿Genera sonido directamente?

Sí. Sonido ambiente, banda sonora y diálogo se producen en la misma pasada que el vídeo — esa es la razón del nombre "omni".

¿Cuál es el límite de duración?

La página oficial indica clips de hasta 10 segundos, con audio nativo, hasta 5 fotos de referencia y edición multi-turno.

¿Cómo será el precio?

Gemini Omni requiere una suscripción Google AI Plus, Pro o Ultra y tener 18+. Algunas funciones (avatares, edición vídeo a vídeo) pueden estar restringidas en ciertos países.

¿Qué es el avatar de IA de Gemini Omni?

Es una versión digital opcional de ti que permite generar vídeos que se parecen y suenan como tú, sin tener que subir fotos cada vez — y solo tú puedes usar tu propio avatar.

Fuentes

Reportes primarios y enlaces públicos

Todo el contenido se agrega desde las fuentes públicas siguientes. Se recomienda cruzar lecturas.

blog.google Leer fuente

Gemini Omni Habla, mira, comparte — vídeo multimodal en una conversación

Cifras clave

Mira lo que realmente produce Gemini Omni

Speak it. See it. Share it.

Entra en la historia

Da vida a tus fotos

Conserva el alma del plano

Remezcla un clip existente

Edición fácil

Sé la estrella

Toda la cadena creativa en un solo modelo

Salida multimodal nativa

Una pila Gemini unificada

Audio nativo sincronizado

Edición directa en el chat

Remezcla y dirige

Plantillas y estilos

Lo que se sabe antes del keynote

Tres líneas de producto fusionadas en un Omni

De un brief a contenido publicable

Anuncios de producto

Reels y Shorts

Videoclips

Cortos cinematográficos

Hero loops de landing

Explicativos y tutoriales

Dónde encaja Omni en el ecosistema de vídeo 2026

¿Gemini Omni es gratis? Cómo usarlo gratis en 2026

Google Flow · Capa gratuita + planes

YouTube Shorts · Gemini Omni gratis

App YouTube Create · Editor móvil gratis

App Gemini · Plus / Pro / Ultra

Cómo generar vídeos de Gemini Omni gratis

De la primera filtración al escenario de I/O 2026

Primer string "Powered by Omni"

Tarjeta de preview en Gemini móvil

Las demos se viralizan

Lanzamiento oficial en Google I/O 2026

Despliegue de avatar de IA, vídeo→vídeo y edición multi-turno

API para desarrolladores y empresas vía Gemini API y Vertex AI

Gemini Omni Pro + salidas de imagen y audio

Lo que más se pregunta sobre Gemini Omni

Reportes primarios y enlaces públicos

Google Blog · Presentamos Gemini Omni

Google Blog · 100 cosas del Google I/O 2026

Google · Página oficial de Gemini Omni

DataCamp · Análisis a fondo de Google I/O 2026

TestingCatalog · Programming Insider

OfficeChai · Gemini Omni Spotted

Looksy AI · página de Gemini Omni

Informe técnico de Gemini 2.5

Gemini Omni
Habla, mira, comparte — vídeo multimodal en una conversación