Gemini Omni 上手教程:Gemini 应用与 Google Flow 实操步骤(2026)
2026 年 Gemini Omni 实操指南 —— 如何开启模型、写视频 prompt、附加参考素材、在对话中编辑、导出带 SynthID 水印的成片。
开始前你需要什么
Gemini Omni Flash 在 2026 年 5 月 20 日 I/O 上正式上线。生成第一段视频前确认:
- Google 账号信誉良好、年龄 18 岁及以上(Omni Flash 有年龄门槛)。
- 若想在 Gemini 应用 或 Google Flow 中使用,需以下任一订阅:
- Google AI Plus
- Google AI Pro
- Google AI Ultra
- 如果只有免费 Google 账号,可在 YouTube Shorts 与 YouTube Create App 内直接使用 Omni Flash。
一台浏览器(Chrome / Edge / Safari / Firefox)+ 稳定网络足矣 —— 无需安装额外软件。Google Flow 是网页应用;Gemini 应用支持网页、Android 与 iOS。
第 1 步 · 选择正确入口
入口决定工作流。三条主线:
- Gemini 应用(gemini.google.com 或移动端)。 适合快速对话生成、随手调整 —— 聊一句拿一条,再聊再改。
- Google Flow(labs.google/flow)。 适合影像创作者、代理商,以及需要分镜的多片段制作。Flow 明确显示积分成本、模型选择器与镜头级控件。
- YouTube Shorts / YouTube Create App。 适合免费、随手的社交创作。Omni 会出现在创作界面里。
任选其一。三者背后的模型相同 —— 都是 Gemini Omni Flash —— 只是界面与控件不同。
第 2 步 · 确认当前模型是 Omni
进入 Gemini 应用,看 prompt 栏的设置:模型选择器里能选 Gemini Omni(当前等价于 Omni Flash)。如果看不到,可能是订阅档或地区还没启用 —— 试着退出再登,或转到 Google Flow,那里模型选择器更显眼。
在 Google Flow 里打开 prompt 面板,确认:
- 当前模型:Gemini Omni Flash
- 比例:16:9 / 9:16 / 1:1
- 时长:通常每段 5 / 8 / 10 秒
- 积分成本:实时显示,版本之间可能变化
Google 帮助文档明确建议每次生成前都检查模型与积分 —— 价格会动。
第 3 步 · 写一份”brief”,不是一句话
Omni 输入输出都是多模态,prompt 写得越像一段创意 brief,效果越稳。可靠模板:
你是 [角色身份]。 生成一段 [时长] [比例] 的视频:[主体] 在 [环境] [做某动作]。 镜头:[镜头 / 运动 / 构图]。 灯光:[方向 / 色温 / 对比度]。 音频:[环境音], [音乐风格], [时间码上的关键音效], 台词:[一句话]。 参考:[附加 图 / 视频 / 音频]。
举例:
你是一位偏王家卫风格的奢侈品摄影指导。 生成一段 10 秒 16:9 视频:一只哑黑无线耳机,放在带颗粒感的混凝土基座上。 镜头:35mm 慢推轨,左→右,浅景深。 灯光:暖金色背光、3200K、低对比。 音频:低沉氛围铺底,0:07 单声柔和铃声。无台词。 参考图:附件的产品图,颜色、缝线与品牌标识为准。
写长一些不是浪费 —— 它实打实减少重生成次数。
第 4 步 · 大胆叠加参考素材
2026 年最大的解锁点是:Omni 能在同一指令中接受图像、视频、音频作为参考。怎么用:
- 角色锁定:参考图固定主角,跨片段保持一致。
- 风格锁定:选一张你想模仿的画面截图。
- 运动锁定:附一段短参考视频复刻镜头运动。
- 节奏锁定:附一段音乐,让 Omni 按拍切画面。
30 字 prompt + 3 张参考几乎总能打赢 300 字 + 无参考。
第 5 步 · 生成后用对话编辑,不要重 roll
第一条视频出来后,别急着改文字重新生成。Omni 的招牌是对话编辑:
“把模特手腕上的手表换成磨砂银计时码表。其它构图、灯光、音轨保持完全不变。”
“运镜放慢 30%,色温暖化 200K。”
“删除 0:07 的铃声,改在 0:08–0:10 加一段柔和氛围铺底。”
“背景换成赛博城市夜景,但主体保持不变。”
对话编辑比重新生成便宜得多、保住已经满意的音轨、保住角色一致性。把第一段当作基底,从那里迭代。
第 6 步 · 串联多段做长视频
Omni Flash 单段 10 秒封顶。要做长片段,多生成几段并把前一段作为参考:
“基于附件这段视频,继续生成一段 10 秒视频。保持主体、服装、灯光与音轨完全一致。运镜从上一段结束位置开始。”
Google Flow 直接提供镜头级串联;Gemini 应用里用”附加参考”也能等价实现。
第 7 步 · 导出、水印与溯源
每段 Omni 导出都自带:
- SynthID:嵌入像素与音频的不可感知水印。
- C2PA Content Credentials:开放标准元数据,标识”由 Gemini 生成”。
可在 Gemini 应用里直接校验 Omni 输出,Chrome 与 Google Search 即将跟进。对创作者来说,这部分完全自动 —— 但值得知道它存在,特别是当你把视频卖给在意 AI 披露的客户时。
第 8 步 · 设置 AI 阿凡达(可选)
如果你希望 Omni 在多条视频中稳定还原你本人,先在 Gemini 应用或 Google Flow 中设置一次 AI 阿凡达:
- 打开阿凡达入口。
- 按提示完成多角度面部与声音采集。
- 确认同意流程 —— 只有本人可使用本人阿凡达。
- 之后 prompt 直接写 “me” 或 “the avatar” 即可,无需再传照片。
Google 明确还在收紧阿凡达的安全控制,地区与功能上会有一段过渡期限制。
常见错误
- 不附参考素材。 纯文字 prompt 最浪费积分。
- 不停重 roll 而非对话编辑。 每次重生成都更贵,且会丢掉已经合拍的音轨。
- 不调整时长。 10 秒不总是最佳,5 秒的紧凑产品镜头常常更便宜、更快、更有力。
- 忘了确认当前模型。 一段切到 Veo 一段切回 Omni,风格自然会漂。
结论
2026 年用好 Gemini Omni,不是去发现什么隐藏开关,而是像导演对剧组那样:写清楚 brief、提供有力参考、要求微调而非重拍、把多段串成长片。把这四件事做扎实,Omni Flash 立刻就成为网络上发布视频最快的方式。