正式リリース · Gemini アプリで Veo を置換

Gemini Omni
話す、見る、共有する — 会話で動画をつくる

2026 年 5 月 19 日、Google が I/O 2026 のメインステージで Gemini Omni を正式発表。Gemini の世界理解とネイティブなマルチモーダル生成（テキスト・画像・動画・同期音声）を 1 つのアーキテクチャに統合し、Gemini アプリ内で Veo 3.1 を置き換えます。画像→動画、動画→動画編集、パーソナル AI アバターも搭載。

プロンプトを生成機能を見る記事

統合モデル同期音声チャット内編集

Omni

Text

Image

Video

Audio

5–10s クリップ長

1080p 最大解像度

16:9 · 9:16 · 1:1 アスペクト比

I/O 2026 発表予定

公式デモ

Gemini Omni の実際の出力を見る

以下の動画はすべて Google 公式 Gemini Omni 製品ページから直接埋め込まれています。テキスト→動画、画像→動画、スタイル転送、チャット編集、動画→動画、AI アバターまでの主要能力をカバーします。

デモ動画の著作権は Google に帰属します。情報集約目的で storage.googleapis.com/gweb-gemini-cdn から直接配信しています。

Speak it. See it. Share it.

Gemini Omni のメインヒーロー動画：会話で動画を生成・リミックス・編集。

公式ページを開く

テキスト→動画

物語の中へ

1 行のテキストプロンプトから、一貫した環境とカメラワークを備えた複数ショットの映像を生成。

画像→動画

写真を動かす

参照画像をアップロードすれば Omni が動きを補完し、タイムラインを自動で埋めます。

スタイル / テンプレ

ショットの魂を保つ

背景や衣装の入れ替え、スタイル転送を行っても被写体のディテールが維持されます。

動画→動画

既存クリップをリミックス

既存の映像を新しいスタイルへ再構成。ライト、レンズ、素材感までプロンプトで書き換え。

チャット編集

簡単な編集

キャラ差し替え、ライティング調整、手ブレ補正——再生成なしでチャットだけで完結。

AI アバター

自分が主役

AI アバターを 1 度設定するだけで、写真を再アップしなくても自分が出演できます。

機能

制作パイプライン全体を 1 つのモデルに集約

Veo / Sora 2 / Seedance 2.0 / Kling などの専用動画モデルとは異なり、Gemini Omni は言語推論・画像生成・動画生成・音声合成を同じアーキテクチャに収めます。

ネイティブなマルチモーダル出力

1 つのプロンプトでテキスト・キーフレーム・動画を同時生成。キャラクター・スタイル・ライティングが各フォーマット間で一貫します。

統一された Gemini スタック

専用モデルを連結する必要はもうありません。テキスト・画像・動画・音声が同じ重みと長いコンテキストを共有します。

同期ネイティブ音声

環境音・スコア・対話が映像と同じフォワードパス内で揃えられます。足音は拍に乗り、口の動きは初回エクスポートからスピーチと合います。

チャット内で直接編集

自然言語でオブジェクトの差し替え・ライティング変更・カメラワーク調整が可能。Nano Banana の編集思想を踏襲し、再生成不要。

リミックスとステアリング

既存クリップをアップロードしプロンプトで方向修正。参照画像・動画・音声を 1 つの指示にまとめられます。

テンプレートとスタイル

製品広告・Reels・MV・シネマティック短編の組み込みテンプレで初心者の敷居を下げ、カメラ言語の一貫性を保ちます。

仕様

基調講演前にわかっていること

以下の数値は Reddit/X のリークと TestingCatalog、Programming Insider、OfficeChai 等の報道をまとめたものです。

項目	判明している情報
モデルファミリー	Google Gemini — Veo 系列の後継ブランド
モデル ID	bard_eac_video_generation_omni / v3smm-lora-prod
クリップ長	1 回の生成で 5 / 8 / 10 秒、アプリ内で連結可能
解像度	480p / 720p / 1080p
アスペクト比	16:9、9:16、1:1
音声	ネイティブ合成、ワンパスで同期
入力	テキスト / 画像 / 動画 / 音声リファレンス
アクセス	Gemini アプリで提供中 (18+、Google AI Plus / Pro / Ultra プラン)
クォータ目安	報告によれば AI Pro の 2 回の Omni 生成で 1 日の約 86% を消費

アーキテクチャ

3 つの製品ラインを 1 つの Omni に統合

Google の生成系スタックはこれまで Veo（動画）、Nano Banana / Imagen（画像）、Gemini（テキスト）に分かれていました。Omni はこれらを 1 つのアーキテクチャにまとめます。

以前

Veo 3.1

動画 + ネイティブ音声

Nano Banana / Imagen

画像生成と編集

Gemini 2.5 / 3.x

推論 · 長コンテキスト

現在 · Omni

Gemini Omni

テキスト · 画像 · 動画 · 音声、1 モデル 1 プロンプト

Text Image Video Audio

ユースケース

1 つのブリーフから公開可能なコンテンツへ

統合モデル + 長コンテキスト + 同期音声により、1 つの一貫したブリーフで完成した編集物まで一気通貫で制作できます。

製品広告

ヒーローショット、パッケージ公開、ライフスタイルカットを環境音とともに納品。

Reels & Shorts

マイクオン対話とビート同期モーションを備えた 9:16 縦型クリップ。SNS 滞在向け。

ミュージックビデオ

トラックを参照すれば Omni がビートに合わせて編集、複数ショットで人物の一貫性を維持。

シネマティック短編

10 秒の omni-clip を複数つなぎ、連続したライティング・人物・音床を保ちます。

ランディングページのヒーローループ

SaaS / ファッション / DTC 向けのループ可能な 16:9 雰囲気素材、ブランド色と無音耐性込み。

解説とチュートリアル

台本をリップシンク付きナレーション映像に変換し、環境音設計も一致。

比較

2026 年の動画生成市場での Omni の立ち位置

Artificial Analysis、Looksy AI、Oimi AI、公式発表からの集約。ベンチマークではなく方向性の把握用。

モデル	提供元	アーキテクチャ	ネイティブ音声	クリップ長
Gemini Omni Omni	Google	統合 Omni（動画 + 画像 + 音声）	ワンパス同期	5 / 8 / 10s
Veo 3.1	Google	専用動画モデル	対応	約 8s
Seedance 2.0	ByteDance	専用マルチモーダル動画	対応	最大 15s / ショット
Sora 2	OpenAI	専用動画モデル	対応	約 20s
Kling V3.0	Kuaishou	専用動画モデル	限定的	約 10s

無料 vs 有料

Gemini Omni は無料？2026 年の無料での使い方

Gemini Omni Flash は Google Flow の無料プラン、YouTube Shorts、YouTube Create アプリで無料です。単体の Gemini アプリには Google AI Plus / Pro / Ultra が必要です。下記の公式入口からすぐに試せます。

labs.google 無料

Google Flow · 無料プラン + 有料プラン

Google の AI 映像制作スタジオ。無料プランでも利用上限付きで Gemini Omni Flash を使えます。上限拡大やプロ向け機能は Plus / Pro / Ultra で。

開く

youtube.com 無料

YouTube Shorts · 無料で Gemini Omni

Shorts 内で Gemini Omni Flash クリップを完全無料で生成。最も安く公式に Omni を体験できる経路。

開く

youtube.com 無料

YouTube Create アプリ · 無料モバイル編集

モバイル向け編集アプリに Gemini Omni Flash を内蔵。AI サブスク不要。

開く

gemini.google.com 有料プラン

Gemini アプリ · Plus / Pro / Ultra

公式 Gemini アプリで Omni を利用。Google AI Plus・Pro・Ultra のいずれかが必要。

開く

無料で Gemini Omni 動画を生成する方法

最短の無料ルート：YouTube Shorts または YouTube Create アプリにログインし、テンプレートを選んで Gemini アプリと同じマルチショット型プロンプトで生成します。

まず無料の YouTube Shorts でカメラワークとテンポを固める。
ブランド品質が必要なときだけ Google AI Plus / Pro に切り替える。
チャット編集で再生成を回避し、有料クレジットを温存する。

無料活用ガイドを読む有料プランを比較料金の詳細解説を読む無料のプロンプトビルダーを開く

無料枠と価格は地域・アカウントで変わります。常に上記の公式ページで最新情報を確認してください。

タイムライン

最初のリークから I/O 2026 のステージへ

公開報道日順、随時更新中。

2026 · 05 · 02
最初の "Powered by Omni" 文字列

X ユーザー @Thomas16937378 が Gemini 動画タブ内で "Start with an idea or try a template. Powered by Omni." を発見。
2026 · 05 · 11
Gemini モバイル内に完全プレビューカード

TestingCatalog と Chetaslua が "Meet our new video model" カード、完全モデル ID、10 秒上限を確認。
2026 · 05 · 12 – 18
デモが拡散

"黒板で三角関数を解く教授" のクリップがテキスト一貫性と物理的忠実度を示し、Veo 3.1 との比較が活発化。
2026 · 05 · 19
Google I/O 2026 メインステージで正式発表

Google が I/O 2026 のメインステージで Gemini Omni を発表。公式製品ページと公式デモ動画を同時公開し、Gemini アプリ内で Veo 3.1 の置換が始まりました。
2026 · 05 · 19 〜
AI アバター・動画→動画・マルチターン編集を順次展開

正式版にはパーソナル AI アバター、動画→動画編集、チャット式マルチターン編集が同梱。地域とサブスクリプション階層により段階的に有効化されます。
今後数週間 · 2026年 · 06月以降
Gemini API と Vertex AI 経由の開発者・エンタープライズ向け API

Google は開発者およびエンタープライズ向けの API 提供が「数週間以内」に始まると確認、確定日時は未発表。アナリストは動画出力 1 秒あたり $0.10〜$0.30 程度と推定。
ロードマップ上
Gemini Omni Pro と画像・音声出力

さらに強力な Omni Pro が次に来ると見られ、音声リファレンス以外のオーディオ入力、画像・音声出力モダリティも拡充され、「任意の入力 → 任意の出力」という約束を完成させる予定。

FAQ

Gemini Omni についてよくある質問

Gemini Omni とは何ですか？

Google が間もなく発表する統合マルチモーダルモデルで、1 つのアーキテクチャ内でテキスト・画像・動画・同期音声を生成します。Veo・Imagen・Gemini の統合形と言えます。

Gemini Omni は無料ですか？

一部無料です。Gemini Omni Flash は Google Flow の無料プラン、YouTube Shorts、YouTube Create アプリで無料で使えます。単体の Gemini アプリで Omni を使うには Google AI Plus / Pro / Ultra の有料プランが必要です。

Gemini Omni の料金はいくらですか？

Google AI Plus は月額約 7.99 米ドルから、AI Pro はクリエイター向けの主流プラン、AI Ultra は月額約 100 米ドルです。AI Pro では Omni Flash の生成 2 回で当日の枠の約 86% を消費するため、リトライは慎重に。開発者向け API は別途料金が告知される予定です。

いつリリースされますか？

既にリリース済みです。2026 年 5 月 19 日に Google I/O 2026 メインステージで Gemini Omni が正式発表され、公式製品ページとデモ動画が同時公開されました。

Veo 3.1 との関係は？

Gemini Omni は Gemini アプリにおける Veo の後継です。Google は「Omni が Gemini アプリ内で Veo を置き換える」と明言しており、動画機能は Gemini のテキスト・画像と同じアーキテクチャに統合されました。

本当に音声も生成しますか？

はい。環境音・スコア・対話が動画と同じパスで生成されます。それが "omni" という名称の理由でもあります。

現在のクリップ長制限は？

公式製品ページでは 1 回あたり最大 10 秒、ネイティブ音声・最大 5 枚までの写真リファレンス・マルチターン編集に対応すると明記されています。

価格設定はどうなりますか？

Gemini Omni の利用には Google AI Plus / Pro / Ultra プランと 18 歳以上であることが必要です。アバターや動画→動画編集など一部機能は地域によって利用できない場合があります。

Gemini Omni の AI アバターとは？

オプションのデジタル分身です。一度設定すれば、写真を毎回アップロードしなくても自分のように見えて聞こえる動画を生成でき、自分のアバターを使えるのは本人のみです。

出典

一次報道と公開リンク

このページの内容は以下の公開ソースを集約したものです。複数ソースの確認を推奨します。

blog.google 原文を読む

Gemini Omni 話す、見る、共有する — 会話で動画をつくる

主要スペック