공식 출시 · Gemini 앱에서 Veo 를 대체

Gemini Omni
말하고, 보고, 공유하기 — 대화로 영상 만들기

2026 년 5 월 19 일, Google 이 I/O 2026 메인 스테이지에서 Gemini Omni 를 공식 발표했습니다. Gemini 의 세계 이해와 네이티브 멀티모달 생성(텍스트·이미지·영상·동기 오디오)을 하나의 아키텍처로 통합하고, Gemini 앱 내에서 Veo 3.1 을 대체합니다. 이미지→영상, 영상→영상 편집, 개인 AI 아바타도 제공합니다.

프롬프트 생성 기능 보기 기사

통합 모델 동기 오디오 채팅 내 편집

Omni

Text

Image

Video

Audio

5–10s 클립 길이

1080p 최대 해상도

16:9 · 9:16 · 1:1 화면비

I/O 2026 공개 예정

공식 데모

Gemini Omni 의 실제 출력 보기

아래 모든 영상은 Google 공식 Gemini Omni 제품 페이지에서 직접 임베드된 것입니다. 텍스트→영상, 이미지→영상, 스타일 전이, 채팅 편집, 영상→영상, AI 아바타까지 주요 기능을 모두 다룹니다.

모든 데모 영상의 저작권은 Google 에 있습니다. 정보 집계 목적이며 storage.googleapis.com/gweb-gemini-cdn 에서 직접 스트리밍합니다.

Speak it. See it. Share it.

Gemini Omni 메인 히어로 영상: 대화로 영상 생성·리믹스·편집.

공식 페이지 보기

텍스트→영상

이야기 속으로

한 줄 텍스트 프롬프트로 일관된 환경과 카메라 워크를 갖춘 멀티숏 영상을 생성합니다.

이미지→영상

사진에 생명을

참조 이미지를 업로드하면 Omni 가 모션을 채워 자동으로 타임라인을 완성합니다.

스타일 / 템플릿

샷의 영혼 유지

배경, 의상 교체나 스타일 전이를 해도 피사체의 디테일이 유지됩니다.

영상→영상

기존 클립 리믹스

기존 영상을 새로운 스타일로 재구성. 조명, 렌즈, 질감까지 프롬프트로 다시 씁니다.

채팅 편집

간편 편집

캐릭터 교체, 조명 조정, 손떨림 보정까지 재생성 없이 채팅만으로 완료.

AI 아바타

내가 주인공

AI 아바타를 한 번 설정하면 사진을 다시 업로드하지 않아도 내가 등장할 수 있습니다.

핵심 기능

전체 제작 파이프라인을 하나의 모델로

Veo / Sora 2 / Seedance 2.0 / Kling 같은 전용 영상 모델과 달리 Gemini Omni 는 언어 추론·이미지 생성·영상 생성·오디오 합성을 동일 아키텍처에 통합합니다.

네이티브 멀티모달 출력

하나의 프롬프트로 텍스트·키프레임·영상이 동시에 생성되며 캐릭터, 스타일, 조명이 모든 포맷에서 일관되게 유지됩니다.

하나의 Gemini 스택

여러 전용 모델을 체인으로 묶을 필요가 없습니다. 텍스트·이미지·영상·오디오가 같은 가중치와 긴 컨텍스트를 공유합니다.

동기화된 네이티브 오디오

환경음, 스코어, 대사가 영상과 같은 전진 패스에서 정렬됩니다. 발걸음은 박자에 맞고, 입 모양은 첫 출력부터 음성과 동기화됩니다.

채팅 내 직접 편집

자연어로 객체 교체, 조명 변경, 카메라 무빙 조정이 가능합니다. Nano Banana 의 편집 방식을 영상으로 확장한 형태입니다.

리믹스와 조정

기존 클립을 업로드해 프롬프트로 재조정합니다. 참조 이미지·영상·오디오를 하나의 명령에 결합할 수 있습니다.

템플릿과 스타일

제품 광고, Reels, 뮤직비디오, 시네마틱 단편 등 내장 템플릿으로 진입 장벽을 낮추고 카메라 언어 일관성을 보장합니다.

사양

기조연설 전 알려진 정보

아래 수치는 Reddit/X 유출과 TestingCatalog, Programming Insider, OfficeChai 등의 보도를 종합한 것입니다.

항목	알려진 정보
모델 패밀리	Google Gemini — Veo 시리즈의 후속 브랜드
모델 ID	bard_eac_video_generation_omni / v3smm-lora-prod
클립 길이	생성당 5 / 8 / 10 초, 앱에서 체이닝 가능
해상도	480p / 720p / 1080p
화면비	16:9, 9:16, 1:1
오디오	네이티브 합성, 단일 패스에서 동기화
입력	텍스트 / 이미지 / 영상 / 오디오 참조
접근	Gemini 앱에서 사용 가능, 18+ Google AI Plus / Pro / Ultra 가입자 대상
쿼터 신호	보고에 따르면 Omni 2 회 생성 시 AI Pro 일일 쿼터의 약 86% 소모

아키텍처

세 개의 제품 라인이 하나의 Omni 로

과거 Google 의 생성 스택은 Veo(영상), Nano Banana / Imagen(이미지), Gemini(텍스트) 로 분리되어 있었습니다. Omni 는 이를 하나의 아키텍처로 통합합니다.

Veo 3.1

영상 + 네이티브 오디오

Nano Banana / Imagen

이미지 생성과 편집

Gemini 2.5 / 3.x

추론 · 긴 컨텍스트

현재 · Omni

Gemini Omni

텍스트 · 이미지 · 영상 · 오디오, 하나의 모델 하나의 프롬프트

Text Image Video Audio

활용 사례

하나의 브리프에서 게시 가능한 콘텐츠까지

통합 모델 + 긴 컨텍스트 + 동기 오디오 덕분에 한 줄 브리프로 스토리보드부터 완성본까지 전 과정을 수행할 수 있습니다.

제품 광고

히어로 샷, 패키지 공개, 라이프스타일 컷을 환경음과 함께 즉시 납품.

Reels & Shorts

9:16 세로 클립에 마이크온 대사와 비트 동기 모션, 스크롤을 멈추는 소셜 콘텐츠.

뮤직비디오

참조 트랙을 주면 Omni 가 비트에 맞춰 컷을 잘라주며 여러 샷에서 캐릭터 일관성을 유지.

시네마틱 단편

10 초짜리 omni-clip 여러 개를 멀티숏 시퀀스로 연결, 조명·인물·음향 베드를 연속 유지.

랜딩 페이지 히어로 루프

SaaS / 패션 / DTC 사이트용 반복 가능한 16:9 분위기 클립, 브랜드 색과 무음 가독성 포함.

설명 영상과 튜토리얼

스크립트를 립싱크 내레이션 시퀀스로 변환하고 환경 사운드 디자인도 함께 맞춤.

비교

2026 영상 생성 시장에서 Omni 의 위치

Artificial Analysis, Looksy AI, Oimi AI, 공식 키노트 정보를 종합 — 벤치마크가 아닌 방향성 파악용.

모델	제공사	아키텍처	네이티브 오디오	클립 길이
Gemini Omni Omni	Google	통합 Omni (영상 + 이미지 + 오디오)	단일 패스 동기	5 / 8 / 10s
Veo 3.1	Google	전용 영상 모델	지원	약 8s
Seedance 2.0	ByteDance	전용 멀티모달 영상	지원	최대 15s / 샷
Sora 2	OpenAI	전용 영상 모델	지원	약 20s
Kling V3.0	Kuaishou	전용 영상 모델	제한적	약 10s

무료 vs 유료

Gemini Omni는 무료인가요? 2026년 무료로 쓰는 방법

Gemini Omni Flash는 Google Flow 무료 등급, YouTube Shorts, YouTube Create 앱에서 무료입니다. 독립형 Gemini 앱에서는 Google AI Plus / Pro / Ultra가 필요합니다. 아래 공식 입구로 바로 이동하세요.

labs.google 무료

Google Flow · 무료 등급 + 요금제

Google의 AI 영상 제작 스튜디오. 무료 등급에도 사용 한도와 함께 Gemini Omni Flash가 포함됩니다. 더 높은 한도와 프로 도구는 Plus / Pro / Ultra로 업그레이드하세요.

열기

youtube.com 무료

YouTube Shorts · 무료 Gemini Omni

Shorts 안에서 Gemini Omni Flash 클립을 무료로 생성. Omni를 가장 저렴하게 공식 체험하는 경로.

열기

youtube.com 무료

YouTube Create 앱 · 무료 모바일 편집

Gemini Omni Flash가 내장된 모바일 편집 앱. AI 구독이 필요 없습니다.

열기

gemini.google.com 유료 플랜

Gemini 앱 · Plus / Pro / Ultra

공식 Gemini 앱에서 Omni 사용. Google AI Plus, Pro 또는 Ultra 플랜이 필요합니다.

열기

Gemini Omni 영상을 무료로 생성하는 방법

가장 빠른 무료 루트: YouTube Shorts 또는 YouTube Create 앱에 로그인하고 템플릿을 선택해 Gemini 앱과 동일한 멀티숏 프롬프트로 생성하세요.

무료인 YouTube Shorts에서 먼저 카메라 워크와 페이싱을 확정.
브랜드급 결과가 필요할 때만 Google AI Plus / Pro 플랜으로 전환.
재생성 대신 대화형 편집을 활용해 유료 크레딧을 아끼세요.

무료 이용 가이드 읽기 유료 플랜 비교 가격 상세 분석 읽기 무료 프롬프트 빌더 열기

무료 할당량과 가격은 지역과 계정에 따라 달라집니다. 위 공식 페이지에서 최신 정보를 확인하세요.

타임라인

첫 유출부터 I/O 2026 무대까지

공개 보도일 순, 계속 업데이트 중.

2026 · 05 · 02
최초 "Powered by Omni" 문자열

X 사용자 @Thomas16937378 가 Gemini 영상 탭에서 "Start with an idea or try a template. Powered by Omni." 문자열을 발견.
2026 · 05 · 11
Gemini 모바일 앱 내 프리뷰 카드

TestingCatalog 와 Chetaslua 가 "Meet our new video model" 카드, 전체 모델 ID, 10 초 클립 상한을 확인.
2026 · 05 · 12 – 18
데모 확산

"칠판에서 삼각함수를 푸는 교수" 클립이 텍스트 일관성과 물리적 정확도를 보여주며 Veo 3.1 과의 비교가 활발해짐.
2026 · 05 · 19
Google I/O 2026 메인 스테이지에서 공식 출시

Google 이 I/O 2026 메인 스테이지에서 Gemini Omni 를 공식 발표하고, 공식 제품 페이지와 데모 영상을 동시 공개. Gemini 앱 내에서 Veo 3.1 대체가 시작됨.
2026 · 05 · 19 이후
AI 아바타·영상→영상·멀티턴 편집 순차 출시

정식 버전과 함께 개인 AI 아바타, 영상→영상 편집, 채팅형 멀티턴 편집이 제공됩니다. 지역과 구독 등급에 따라 단계적으로 활성화됩니다.
앞으로 몇 주 · 2026 · 06+
Gemini API와 Vertex AI를 통한 개발자·기업용 API

Google은 개발자 및 기업 고객용 API 접근을 "앞으로 몇 주 안에" 제공한다고 확정했으나 구체 일정은 미정. 애널리스트는 영상 출력 1초당 $0.10~$0.30 수준으로 추산.
로드맵
Gemini Omni Pro 및 이미지·오디오 출력

다음에는 더 강력한 Omni Pro가 이어질 것으로 예상되며, 음성 레퍼런스를 넘어선 풍부한 오디오 입력과 이미지·오디오 출력 모달리티까지 확장돼 "어떤 입력 → 어떤 출력"이라는 약속을 완성할 예정이다.

FAQ

Gemini Omni 에 대해 가장 자주 묻는 질문

Gemini Omni 는 정확히 무엇인가요?

Google 이 곧 발표할 통합 멀티모달 모델로, 하나의 아키텍처 안에서 텍스트·이미지·영상·동기 오디오를 네이티브로 생성합니다. 사실상 Veo, Imagen, Gemini 의 통합입니다.

Gemini Omni는 무료인가요?

부분적으로 무료입니다. Gemini Omni Flash는 Google Flow 무료 등급, YouTube Shorts, YouTube Create 앱에서 무료로 사용할 수 있습니다. 독립형 Gemini 앱에서 Omni를 사용하려면 Google AI Plus, Pro 또는 Ultra 유료 플랜이 필요합니다.

Gemini Omni의 가격은 얼마인가요?

Google AI Plus는 월 7.99달러부터 시작하고, AI Pro는 크리에이터에게 가장 일반적인 등급이며, AI Ultra는 월 약 100달러입니다. AI Pro에서 Omni Flash 2회 생성으로 일일 한도의 약 86%를 소모하므로 재시도는 신중히 계획하세요. 개발자 API는 별도 가격이 안내될 예정입니다.

언제 출시되나요?

이미 출시되었습니다. 2026 년 5 월 19 일 Google I/O 2026 메인 스테이지에서 Gemini Omni 가 공식 발표되었고, 공식 제품 페이지와 데모 영상도 동시에 공개되었습니다.

Veo 3.1 과 어떤 관계인가요?

Gemini Omni 는 Gemini 앱 내 Veo 의 후속 모델입니다. Google 은 "Omni 가 Gemini 앱 내에서 Veo 를 대체한다" 고 명시했으며, 영상 기능이 Gemini 의 텍스트·이미지와 같은 아키텍처로 통합되었습니다.

정말로 소리를 직접 생성하나요?

네. 환경음, 스코어, 대사가 영상과 같은 패스에서 생성됩니다. 이것이 "omni" 라는 이름의 핵심 이유입니다.

현재 클립 길이 제한은?

공식 제품 페이지에는 1 회 최대 10 초, 네이티브 오디오, 최대 5 장의 사진 참조와 멀티턴 편집이 가능하다고 명시되어 있습니다.

가격은 어떻게 책정될까요?

Gemini Omni 는 Google AI Plus / Pro / Ultra 구독과 만 18 세 이상 조건이 필요합니다. 일부 기능(아바타, 영상→영상 편집)은 지역에 따라 제한될 수 있습니다.

Gemini Omni 의 AI 아바타란?

선택형 디지털 분신입니다. 한 번 설정하면 매번 사진을 새로 올리지 않아도 본인처럼 보이고 들리는 영상을 만들 수 있으며, 자신의 아바타는 본인만 사용할 수 있습니다.

출처

1 차 보도와 공개 링크

이 페이지의 내용은 아래 공개 출처를 종합한 것입니다. 교차 확인을 권장합니다.

blog.google 원문 보기

Gemini Omni 말하고, 보고, 공유하기 — 대화로 영상 만들기

주요 스펙