Gemini Omni
Утечки · Google I/O 2026

Gemini Omni
Одна модель — текст, изображение, видео и аудио

Появившаяся в нескольких утечках в начале мая 2026 года, Gemini Omni — это будущая объединённая мультимодальная модель Google: нативная генерация текста, изображения, видео и синхронного звука в одной системе на базе Gemini.

Единая модель Синхронный звук Редактирование в чате
Omni
Text
Image
Video
Audio

Ключевые цифры

5–10s Длина клипа
1080p Макс. разрешение
16:9 · 9:16 · 1:1 Соотношения сторон
I/O 2026 Ожидаемый анонс
Возможности

Весь конвейер творчества в одной модели

В отличие от специализированных видеомоделей вроде Veo, Sora 2, Seedance 2.0 или Kling, Gemini Omni удерживает рассуждение, генерацию изображений, генерацию видео и синтез звука в одной архитектуре.

Нативный мультимодальный вывод

Один промпт даёт согласованные текст, ключевые кадры и видео — персонажи, стиль и свет сохраняются во всех форматах.

Единый стек Gemini

Больше не нужно соединять специализированные модели. Текст, изображение, видео и аудио делят те же веса и тот же длинный контекст.

Синхронный нативный звук

Эмбиент, музыка и диалог выравниваются с картинкой в том же проходе — шаги попадают в бит, губы синхронизируются с речью с первого экспорта.

Прямое редактирование в чате

Замените объект, измените освещение, поправьте движение камеры на естественном языке — без повторной генерации, в духе Nano Banana.

Ремикс и направление

Загрузите существующий клип и перенаправьте его промптами. Опорные изображения, видео и звуки сочетаются в одной инструкции.

Шаблоны и стили

Встроенные шаблоны для рекламы продукта, Reels, музыкальных клипов и кинематографичных короткометражек снижают порог входа и удерживают единый язык кадра.

Спецификации

Что можно собрать до основной презентации

Цифры ниже — это сводка утечек из Reddit/X и репортажей TestingCatalog, Programming Insider и OfficeChai.

Параметр Известная информация
Семейство Google Gemini — бренд-наследник линейки Veo
ID модели bard_eac_video_generation_omni / v3smm-lora-prod
Длина клипа 5 / 8 / 10 секунд за генерацию, склеиваемых в приложении
Разрешение 480p / 720p / 1080p
Соотношения сторон 16:9, 9:16, 1:1
Аудио Нативно синтезируется, синхронизируется за один проход
Входы Текст / изображение / видео / аудио-референсы
Доступ Стейджинг в приложении Gemini, API ожидается после I/O
Квота По сообщениям, две генерации Omni съедают ~86 % дневной квоты AI Pro
Архитектура

Три продуктовые линейки сливаются в один Omni

Генеративный стек Google ранее делился на Veo (видео), Nano Banana / Imagen (изображения) и Gemini (текст). Omni объединяет их в единую архитектуру.

Раньше

Veo 3.1

Видео + нативное аудио

Nano Banana / Imagen

Генерация и редактирование изображений

Gemini 2.5 / 3.x

Рассуждение · длинный контекст

Сейчас · Omni

Gemini Omni

Текст · изображение · видео · аудио, одна модель, один промпт

Text Image Video Audio
Кейсы

От брифа до публикуемого контента

Единая модель + длинный контекст + синхронный звук означают: можно написать связный бриф и сразу получить готовый монтаж.

01

Реклама продукта

Hero-кадры, раскрытие упаковки и lifestyle-сцены с уже встроенным эмбиентом.

02

Reels и Shorts

Вертикальные клипы 9:16 с диалогом on-mic и движением в бит — для удержания внимания в ленте.

03

Музыкальные клипы

Дайте трек как референс — Omni режет видео в бит и сохраняет персонажа в нескольких кадрах.

04

Кинематографичные короткометражки

Сцепите несколько 10-секундных omni-clip в мультикадровые сцены с непрерывным светом и звуковой подложкой.

05

Hero-лупы для лендингов

Зацикливаемые 16:9 атмосферные ролики для SaaS, fashion и DTC — с брендингом и читаемостью без звука.

06

Объяснения и туториалы

Превратите скрипт в нарратив с lip-sync диалогом и соответствующим эмбиентом.

Сравнение

Где Omni стоит в видео-стеке 2026

Сводка по Artificial Analysis, Looksy AI, Oimi AI и официальным презентациям — для ориентира, а не бенчмарка.

Модель Разработчик Архитектура Нативное аудио Длина клипа
Gemini Omni Omni
Google Единый Omni (видео + изображение + аудио) Синхронизация за один проход 5 / 8 / 10s
Veo 3.1
Google Специализированная видео-модель Да ~8s
Seedance 2.0
ByteDance Специализированное мультимодальное видео Да до 15s / план
Sora 2
OpenAI Специализированная видео-модель Да ~20s
Kling V3.0
Kuaishou Специализированная видео-модель Ограничено ~10s
Таймлайн

От первой утечки до сцены I/O 2026

Отсортировано по дате публичного репорта, обновляется.

  1. 2026 · 05 · 02

    Первая строка "Powered by Omni"

    Пользователь X @Thomas16937378 заметил строку "Start with an idea or try a template. Powered by Omni." во вкладке видео Gemini.

  2. 2026 · 05 · 11

    Полная карточка превью в Gemini mobile

    TestingCatalog и Chetaslua показали карточку "Meet our new video model", полный ID модели и ограничение в 10 секунд.

  3. 2026 · 05 · 12 – 18

    Демо расходятся по сети

    Клип "профессор решает тригонометрию на доске" продемонстрировал согласованность текста и физическую достоверность, разогнав сравнения с Veo 3.1.

  4. 2026 · 05 · 19 – 20

    Ожидаемый анонс на Google I/O 2026

    На основной сцене широко ожидается Omni, возможно вместе с разделением Flash / Pro, API и новой структурой подписок.

FAQ

Самые частые вопросы о Gemini Omni

Что такое Gemini Omni?

Это будущая объединённая мультимодальная модель Google, которая нативно генерирует текст, изображения, видео и синхронный звук в одной архитектуре — фактически слияние Veo, Imagen и Gemini.

Когда выходит?

К середине мая 2026 Omni всё ещё в фазе утечек. Ожидаемая презентация — основной keynote Google I/O 2026 (19–20 мая).

Как связан с Veo 3.1?

Метаданные говорят, что Omni инженерно наследует стек Veo, но отказывается от бренда Veo и сворачивает видео в текстовые и графические слои Gemini.

Он правда генерирует звук?

Да. Эмбиент, музыка и диалог производятся в том же проходе, что и видео — именно ради этого название "omni".

Какое сейчас ограничение по длине клипа?

Утёкший ID модели показывает 5, 8 или 10 секунд на генерацию, со склейкой на стороне клиента.

Как будет с ценой?

Не подтверждено. Скриншот с Reddit показывает, что две генерации Omni выжигают ~86 % дневной квоты AI Pro — вероятен новый тариф "Ultra / Pro Plus".