发布于 2026年5月25日 9 分钟阅读

Gemini Omni 上手教程：Gemini 应用与 Google Flow 实操步骤（2026）

2026 年 Gemini Omni 实操指南 —— 如何开启模型、写视频 prompt、附加参考素材、在对话中编辑、导出带 SynthID 水印的成片。

Gemini Omni如何使用教程Google FlowGemini 应用2026

开始前你需要什么

Gemini Omni Flash 在 2026 年 5 月 20 日 I/O 上正式上线。生成第一段视频前确认：

Google 账号信誉良好、年龄 18 岁及以上（Omni Flash 有年龄门槛）。
若想在 Gemini 应用 或 Google Flow 中使用，需以下任一订阅：
- Google AI Plus
- Google AI Pro
- Google AI Ultra
如果只有免费 Google 账号，可在 YouTube Shorts 与 YouTube Create App 内直接使用 Omni Flash。

一台浏览器（Chrome / Edge / Safari / Firefox）+ 稳定网络足矣 —— 无需安装额外软件。Google Flow 是网页应用；Gemini 应用支持网页、Android 与 iOS。

第 1 步 · 选择正确入口

入口决定工作流。三条主线：

Gemini 应用（gemini.google.com 或移动端）。 适合快速对话生成、随手调整 —— 聊一句拿一条，再聊再改。
Google Flow（labs.google/flow）。 适合影像创作者、代理商，以及需要分镜的多片段制作。Flow 明确显示积分成本、模型选择器与镜头级控件。
YouTube Shorts / YouTube Create App。 适合免费、随手的社交创作。Omni 会出现在创作界面里。

任选其一。三者背后的模型相同 —— 都是 Gemini Omni Flash —— 只是界面与控件不同。

第 2 步 · 确认当前模型是 Omni

进入 Gemini 应用，看 prompt 栏的设置：模型选择器里能选 Gemini Omni（当前等价于 Omni Flash）。如果看不到，可能是订阅档或地区还没启用 —— 试着退出再登，或转到 Google Flow，那里模型选择器更显眼。

在 Google Flow 里打开 prompt 面板，确认：

当前模型：Gemini Omni Flash
比例：16:9 / 9:16 / 1:1
时长：通常每段 5 / 8 / 10 秒
积分成本：实时显示，版本之间可能变化

Google 帮助文档明确建议每次生成前都检查模型与积分 —— 价格会动。

第 3 步 · 写一份”brief”，不是一句话

Omni 输入输出都是多模态，prompt 写得越像一段创意 brief，效果越稳。可靠模板：

你是 [角色身份]。生成一段 [时长] [比例] 的视频：[主体] 在 [环境] [做某动作]。镜头：[镜头 / 运动 / 构图]。灯光：[方向 / 色温 / 对比度]。音频：[环境音], [音乐风格], [时间码上的关键音效], 台词：[一句话]。参考：[附加图 / 视频 / 音频]。

举例：

你是一位偏王家卫风格的奢侈品摄影指导。 生成一段 10 秒 16:9 视频：一只哑黑无线耳机，放在带颗粒感的混凝土基座上。 镜头：35mm 慢推轨，左→右，浅景深。 灯光：暖金色背光、3200K、低对比。 音频：低沉氛围铺底，0:07 单声柔和铃声。无台词。 参考图：附件的产品图，颜色、缝线与品牌标识为准。

写长一些不是浪费 —— 它实打实减少重生成次数。

第 4 步 · 大胆叠加参考素材

2026 年最大的解锁点是：Omni 能在同一指令中接受图像、视频、音频作为参考。怎么用：

角色锁定：参考图固定主角，跨片段保持一致。
风格锁定：选一张你想模仿的画面截图。
运动锁定：附一段短参考视频复刻镜头运动。
节奏锁定：附一段音乐，让 Omni 按拍切画面。

30 字 prompt + 3 张参考几乎总能打赢 300 字 + 无参考。

第 5 步 · 生成后用对话编辑，不要重 roll

第一条视频出来后，别急着改文字重新生成。Omni 的招牌是对话编辑：

“把模特手腕上的手表换成磨砂银计时码表。其它构图、灯光、音轨保持完全不变。”

“运镜放慢 30%，色温暖化 200K。”

“删除 0:07 的铃声，改在 0:08–0:10 加一段柔和氛围铺底。”

“背景换成赛博城市夜景，但主体保持不变。”

对话编辑比重新生成便宜得多、保住已经满意的音轨、保住角色一致性。把第一段当作基底，从那里迭代。

第 6 步 · 串联多段做长视频

Omni Flash 单段 10 秒封顶。要做长片段，多生成几段并把前一段作为参考：

“基于附件这段视频，继续生成一段 10 秒视频。保持主体、服装、灯光与音轨完全一致。运镜从上一段结束位置开始。”

Google Flow 直接提供镜头级串联；Gemini 应用里用”附加参考”也能等价实现。

第 7 步 · 导出、水印与溯源

每段 Omni 导出都自带：

SynthID：嵌入像素与音频的不可感知水印。
C2PA Content Credentials：开放标准元数据，标识”由 Gemini 生成”。

可在 Gemini 应用里直接校验 Omni 输出，Chrome 与 Google Search 即将跟进。对创作者来说，这部分完全自动 —— 但值得知道它存在，特别是当你把视频卖给在意 AI 披露的客户时。

第 8 步 · 设置 AI 阿凡达（可选）

如果你希望 Omni 在多条视频中稳定还原你本人，先在 Gemini 应用或 Google Flow 中设置一次 AI 阿凡达：

打开阿凡达入口。
按提示完成多角度面部与声音采集。
确认同意流程 —— 只有本人可使用本人阿凡达。
之后 prompt 直接写 “me” 或 “the avatar” 即可，无需再传照片。

Google 明确还在收紧阿凡达的安全控制，地区与功能上会有一段过渡期限制。

常见错误

不附参考素材。 纯文字 prompt 最浪费积分。
不停重 roll 而非对话编辑。 每次重生成都更贵，且会丢掉已经合拍的音轨。
不调整时长。 10 秒不总是最佳，5 秒的紧凑产品镜头常常更便宜、更快、更有力。
忘了确认当前模型。 一段切到 Veo 一段切回 Omni，风格自然会漂。

结论

2026 年用好 Gemini Omni，不是去发现什么隐藏开关，而是像导演对剧组那样：写清楚 brief、提供有力参考、要求微调而非重拍、把多段串成长片。把这四件事做扎实，Omni Flash 立刻就成为网络上发布视频最快的方式。