Gemini Omni 2026 年 5 月版本说明:I/O 已上线与下一步路线图
2026 年 5 月 19 日 Gemini Omni Flash 正式发布的完整复盘 —— Gemini App、Google Flow、YouTube Shorts 与 YouTube Create 上已生效的能力,以及 API 与 Omni Pro 的最新进度。
一句话总结 —— 截至 2026 年 5 月 27 日上线了什么
- Gemini Omni Flash 已于 2026 · 05 · 19 在 Google I/O 上全球上线。
- YouTube Shorts Remix 与 YouTube Create 免费可用(18 岁以上)。
- Gemini App 与 Google Flow 中由 Google AI Plus($7.99/月)、Pro($19.99/月)、Ultra 订阅解锁。
- 输出为视频,单段最长 10 秒,自带原生音频与全程 SynthID 数字水印。
- 面向开发者 / 企业的 API 尚未开放,Google 仅承诺”在接下来几周内”通过 Gemini API 与 Vertex AI 推出。
如果只记三件事:Omni Flash 已发布、API 尚未开放、Omni Pro 已在路上。
各产品入口现状
Gemini App
Omni Flash 已经在 Plus / Pro / Ultra 订阅档内取代原先基于 Veo 3.1 的视频生成器。最大的体验变化是对话式编辑:生成一段视频后,可以直接说”把背景改成下雨的东京街头”或”给他换件皮夹克”,无需从头重新输入提示词。模型会保留多轮上下文与角色一致性。
Google Flow
对创作工作流来说,Flow 现在是 Omni 能力最完整的入口:可以把参考图、音频片段与既有素材一起塞进同一个 Omni 提示,再按场景逐条迭代,同时保持跨镜头的角色一致。基于对话驱动的场景时间轴,是 5 月 19 日发布的核心 UX 改动。
YouTube Shorts Remix
这是首次有前沿视频模型在发布当天就原生进入一个 20 亿用户级平台。挑一段允许 Remix 的 Shorts,输入你想要的改动(把自己放进画面、加一段视觉引用、换个场景),点击发布 —— 全过程不用离开 YouTube 移动 App。Omni 生成的内容会通过 SynthID 在 Shorts 发现页被自动标注为 AI 生成。
YouTube Create
桌面端 / 平板端的创作者套件同样可用 Omni Flash,并支持把多段生成在项目内串接成更长内容。单次生成仍是 10 秒上限。
模型本身的新能力
相比此前泄露阶段以 Veo 3.1 为底的版本,正式上线的 Omni Flash 新增:
- 物理感知渲染 —— 流体、布料、物体交互在编辑前后保持合理。
- 角色一致性 —— 跨镜头与多轮编辑都能维持同一身份与声音。
- AI Avatar —— 一次设置,后续视频都能复用的个人专属数字分身(首发仅支持语音引用,更多音频输入类型即将开放)。
- 对话式多轮编辑 —— 全程保留上下文,无需从头重新提示。
- 每段视频自带 SynthID 水印 —— 可在 Gemini App、Chrome 中的 Gemini 与 Google Search 中校验。
- 统一模型栈 —— Omni 把原先分离的 Veo(视频)、Imagen(图像)与独立的音频系统收进同一个模型,理论上能显著减少跨模态拼接产生的瑕疵。
Google 在发布时并未同步公布量化基准成绩,独立评测仍在等待 API 开放 —— 这也是接下来最值得关注的节点。
同步发布的订阅档位调整
I/O 2026 重新组织了 Google 的 AI 订阅梯度:
| 档位 | 新月费 | 主要权益 |
|---|---|---|
| AI Plus | $7.99 | Gemini App + Flow 内的 Omni Flash,入门额度 |
| AI Pro | $19.99 | 更高 Omni 配额与 Flow 积分 |
| AI Ultra(新增入口档) | $100(新档位) | Gemini 与 Antigravity 5× 用量、20TB 云存储 |
| AI Ultra(完整档) | $200(原 $249.99) | 最高额度、优先访问、全功能 |
新增的 $100 AI Ultra 档位明确针对开发者、技术负责人与高阶创作者 —— 它大概率是 API 开放后最具性价比的 Omni 重度使用入口。
还在路上的能力 —— 公开路线图
Google 已经公开承认 5 月 19 日发布不包含但正在推进的项目:
- 开发者 / 企业 API —— Omni Flash 经 Gemini API + Vertex AI 开放,“接下来几周内”,无确切日期、无官方定价。第三方分析估算定价在 $0.10 ~ $0.30 / 秒视频 区间,将处在 Runway Gen-4 同档、Veo 下方的位置。
- Gemini Omni Pro —— 同家族更强模型已被预告,预计在 $100 AI Ultra 档首发,覆盖更长时长与更高分辨率。
- 更多音频输入 —— 首发仅支持语音引用,更丰富的音频输入类型与音频输出已被列入计划。
- 图像输出模态 —— Omni 起步是视频,但长期目标是”任意输入 → 任意输出”,图像与音频输出已被官方承诺,未给确切日期。
- 更广地区覆盖与 Workspace 集成 —— 阶梯放量持续中;当前账号还没有看到入口属于预期之内。
对你意味着什么
- 在 YouTube 发内容:今天就可以免费用上 Omni,无需等候名单。
- 在做 SaaS / 生产管线:暂时按住 API,目前没有任何受支持的方式把 Omni Flash 接入后端。
- 在挑订阅档位:新 $100 AI Ultra 是 Omni 重度用户的分水岭,特别是 API 上线之后。
- 在用 Gemini App 内的 Veo 3.1:你其实已经被切到 Omni 了 —— 建议重新测试一遍提示词,把”角色一致性”和”对话式编辑”的收益用足。
我们会在 API 时间表、Omni Pro 细节公布时持续更新本文。