Gemini Omni
返回文章列表
6 分钟阅读

Gemini Omni 2026 年 5 月版本说明:I/O 已上线与下一步路线图

2026 年 5 月 19 日 Gemini Omni Flash 正式发布的完整复盘 —— Gemini App、Google Flow、YouTube Shorts 与 YouTube Create 上已生效的能力,以及 API 与 Omni Pro 的最新进度。

Gemini OmniGemini Omni FlashGoogle I/O 2026版本说明更新日志2026

一句话总结 —— 截至 2026 年 5 月 27 日上线了什么

  • Gemini Omni Flash 已于 2026 · 05 · 19 在 Google I/O 上全球上线。
  • YouTube Shorts Remix 与 YouTube Create 免费可用(18 岁以上)。
  • Gemini App 与 Google Flow 中由 Google AI Plus($7.99/月)、Pro($19.99/月)、Ultra 订阅解锁。
  • 输出为视频,单段最长 10 秒,自带原生音频与全程 SynthID 数字水印。
  • 面向开发者 / 企业的 API 尚未开放,Google 仅承诺”在接下来几周内”通过 Gemini API 与 Vertex AI 推出。

如果只记三件事:Omni Flash 已发布、API 尚未开放、Omni Pro 已在路上。

各产品入口现状

Gemini App

Omni Flash 已经在 Plus / Pro / Ultra 订阅档内取代原先基于 Veo 3.1 的视频生成器。最大的体验变化是对话式编辑:生成一段视频后,可以直接说”把背景改成下雨的东京街头”或”给他换件皮夹克”,无需从头重新输入提示词。模型会保留多轮上下文与角色一致性。

Google Flow

对创作工作流来说,Flow 现在是 Omni 能力最完整的入口:可以把参考图、音频片段与既有素材一起塞进同一个 Omni 提示,再按场景逐条迭代,同时保持跨镜头的角色一致。基于对话驱动的场景时间轴,是 5 月 19 日发布的核心 UX 改动。

YouTube Shorts Remix

这是首次有前沿视频模型在发布当天就原生进入一个 20 亿用户级平台。挑一段允许 Remix 的 Shorts,输入你想要的改动(把自己放进画面、加一段视觉引用、换个场景),点击发布 —— 全过程不用离开 YouTube 移动 App。Omni 生成的内容会通过 SynthID 在 Shorts 发现页被自动标注为 AI 生成。

YouTube Create

桌面端 / 平板端的创作者套件同样可用 Omni Flash,并支持把多段生成在项目内串接成更长内容。单次生成仍是 10 秒上限。

模型本身的新能力

相比此前泄露阶段以 Veo 3.1 为底的版本,正式上线的 Omni Flash 新增:

  • 物理感知渲染 —— 流体、布料、物体交互在编辑前后保持合理。
  • 角色一致性 —— 跨镜头与多轮编辑都能维持同一身份与声音。
  • AI Avatar —— 一次设置,后续视频都能复用的个人专属数字分身(首发仅支持语音引用,更多音频输入类型即将开放)。
  • 对话式多轮编辑 —— 全程保留上下文,无需从头重新提示。
  • 每段视频自带 SynthID 水印 —— 可在 Gemini App、Chrome 中的 Gemini 与 Google Search 中校验。
  • 统一模型栈 —— Omni 把原先分离的 Veo(视频)、Imagen(图像)与独立的音频系统收进同一个模型,理论上能显著减少跨模态拼接产生的瑕疵。

Google 在发布时并未同步公布量化基准成绩,独立评测仍在等待 API 开放 —— 这也是接下来最值得关注的节点。

同步发布的订阅档位调整

I/O 2026 重新组织了 Google 的 AI 订阅梯度:

档位新月费主要权益
AI Plus$7.99Gemini App + Flow 内的 Omni Flash,入门额度
AI Pro$19.99更高 Omni 配额与 Flow 积分
AI Ultra(新增入口档)$100(新档位)Gemini 与 Antigravity 5× 用量、20TB 云存储
AI Ultra(完整档)$200(原 $249.99)最高额度、优先访问、全功能

新增的 $100 AI Ultra 档位明确针对开发者、技术负责人与高阶创作者 —— 它大概率是 API 开放后最具性价比的 Omni 重度使用入口。

还在路上的能力 —— 公开路线图

Google 已经公开承认 5 月 19 日发布不包含但正在推进的项目:

  1. 开发者 / 企业 API —— Omni Flash 经 Gemini API + Vertex AI 开放,“接下来几周内”,无确切日期、无官方定价。第三方分析估算定价在 $0.10 ~ $0.30 / 秒视频 区间,将处在 Runway Gen-4 同档、Veo 下方的位置。
  2. Gemini Omni Pro —— 同家族更强模型已被预告,预计在 $100 AI Ultra 档首发,覆盖更长时长与更高分辨率。
  3. 更多音频输入 —— 首发仅支持语音引用,更丰富的音频输入类型与音频输出已被列入计划。
  4. 图像输出模态 —— Omni 起步是视频,但长期目标是”任意输入 → 任意输出”,图像与音频输出已被官方承诺,未给确切日期。
  5. 更广地区覆盖与 Workspace 集成 —— 阶梯放量持续中;当前账号还没有看到入口属于预期之内。

对你意味着什么

  • 在 YouTube 发内容:今天就可以免费用上 Omni,无需等候名单。
  • 在做 SaaS / 生产管线:暂时按住 API,目前没有任何受支持的方式把 Omni Flash 接入后端。
  • 在挑订阅档位:新 $100 AI Ultra 是 Omni 重度用户的分水岭,特别是 API 上线之后。
  • 在用 Gemini App 内的 Veo 3.1:你其实已经被切到 Omni 了 —— 建议重新测试一遍提示词,把”角色一致性”和”对话式编辑”的收益用足。

我们会在 API 时间表、Omni Pro 细节公布时持续更新本文。