Gemini Omni
Tayang sekarang · Menggantikan Veo di aplikasi Gemini

Gemini Omni
Ucapkan. Lihat. Bagikan.

Diperkenalkan di panggung utama Google I/O 2026, Gemini Omni menyatukan pemahaman dunia Gemini dengan pembangkitan multimodal native — teks, gambar, video, dan audio tersinkron dalam satu arsitektur. Kini menggantikan Veo 3.1 di dalam aplikasi Gemini dan hadir dengan image-to-video, editing video-to-video, dan avatar AI personal.

Model terpadu Audio tersinkron Editing dalam chat
Omni
Text
Image
Video
Audio

Statistik singkat

5–10 dtk Durasi klip
1080p Output maks
16:9 · 9:16 · 1:1 Rasio aspek
I/O 2026 Pengungkapan diharapkan
Demo resmi

Lihat yang sebenarnya dihasilkan Gemini Omni

Setiap klip di bawah disematkan langsung dari halaman produk resmi Gemini Omni milik Google: text-to-video, image-to-video, transfer gaya, editing chat, video-to-video, dan avatar AI — seluruh permukaan kemampuan.

Semua video demo © Google, digunakan di sini untuk agregasi informasi; dialirkan langsung dari storage.googleapis.com/gweb-gemini-cdn.

Ucapkan. Lihat. Bagikan.

Reel hero utama Gemini Omni: buat, remix, dan edit video melalui percakapan.

Lihat halaman resmi
Teks → video

Masuk ke dalam cerita

Satu prompt teks menghasilkan klip multi-shot dengan lingkungan dan bahasa kamera yang kohesif.

Gambar → video

Hidupkan foto

Unggah gambar referensi dan Omni mengarahkan gerakannya, mengisi timeline secara otomatis.

Gaya · template

Jaga jiwa shot

Ganti latar, ubah pakaian, atau transfer gaya — subjek Anda tetap menjaga detailnya.

Video → video

Remix klip yang ada

Susun ulang footage dengan gaya baru — pencahayaan, lensa, bahkan material ditulis ulang lewat prompt.

Editing chat

Editing mudah

Ganti karakter, sesuaikan pencahayaan, stabilkan shot — semua dengan chatting, tanpa regenerasi.

Avatar AI

Jadilah bintang acara Anda sendiri

Atur avatar AI sekali, lalu bintangi setiap video di masa depan tanpa unggah ulang foto.

Kemampuan

Seluruh pipeline menyatu dalam satu model

Tidak seperti model video spesialis seperti Veo, Sora 2, Seedance 2.0, atau Kling, Gemini Omni menjaga penalaran bahasa, pembangkitan gambar, pembangkitan video, dan sintesis audio dalam satu arsitektur.

Output multimodal native

Satu prompt menghasilkan teks, keyframe, dan video yang serasi, dengan karakter, gaya, dan pencahayaan konsisten lintas format.

Satu stack Gemini terpadu

Tidak perlu lagi merangkai banyak model spesialis. Teks, gambar, video, dan audio berbagi bobot dan konteks panjang yang sama.

Audio native tersinkron

Suara ambient, skor, dan dialog selaras dengan gambar dalam satu forward pass — langkah kaki sesuai irama, gerak bibir cocok dengan ucapan sejak ekspor pertama.

Editing langsung dalam chat

Tukar objek, ubah pencahayaan, atau sesuaikan gerakan kamera dengan bahasa alami — tanpa regenerasi penuh, menggemakan playbook editing Nano Banana.

Remix dan arahkan

Unggah klip yang sudah ada dan arahkan ulang dengan prompt. Gambar, video, dan audio referensi dapat digabungkan dalam satu instruksi.

Template & gaya

Template bawaan untuk iklan produk, Reels, klip musik, dan film pendek sinematik menurunkan ambang bagi pengguna pertama sekaligus menjaga bahasa kamera tetap konsisten.

Spesifikasi

Apa yang bisa dirangkai sebelum keynote

Angka di bawah dirangkum dari kebocoran Reddit/X serta laporan TestingCatalog, Programming Insider, dan OfficeChai.

Dimensi Sinyal yang diketahui
Famili model Google Gemini — penerus branding lini Veo
Model ID bard_eac_video_generation_omni / v3smm-lora-prod
Durasi klip 5 / 8 / 10 detik per generasi, dapat dirangkai di aplikasi
Resolusi 480p / 720p / 1080p
Rasio aspek 16:9, 9:16, 1:1
Audio Disintesis secara native, tersinkron dalam satu pass
Input Referensi teks / gambar / video / audio
Akses Tayang di dalam aplikasi Gemini untuk pelanggan Google AI Plus / Pro / Ultra usia 18+
Sinyal kuota Laporan menyebut dua generasi Omni menghabiskan ~86% kuota harian AI Pro
Arsitektur

Tiga lini produk menyatu menjadi satu Omni

Stack generatif Google dulunya terbagi: Veo untuk video, Nano Banana / Imagen untuk gambar, dan Gemini untuk teks. Omni menggulungnya menjadi satu arsitektur.

Sebelum

Veo 3.1

Video + audio native

Nano Banana / Imagen

Pembangkitan & editing gambar

Gemini 2.5 / 3.x

Penalaran · konteks panjang

Sekarang · Omni

Gemini Omni

Teks · gambar · video · audio, satu model, satu prompt

Text Image Video Audio
Kasus penggunaan

Dari satu brief menjadi konten siap publikasi

Model terpadu dengan konteks panjang dan audio tersinkron berarti tim dapat menulis satu brief yang koheren dan pulang dengan hasil cut yang sudah jadi.

01

Iklan produk

Hero shot, reveal kemasan, dan cut gaya hidup tayang dengan audio ambient sudah terkunci.

02

Reels & Shorts

Klip vertikal 9:16 dengan dialog on-mic dan gerak sinkron beat, dibangun untuk menghentikan scroll.

03

Klip musik

Referensikan satu track dan Omni memotong visual sesuai irama, menjaga karakter konsisten antarshot.

04

Film pendek sinematik

Rangkai beberapa omni-clip 10 detik menjadi sekuens multi-shot dengan pencahayaan dan bed audio kontinu.

05

Hero loop landing page

Klip atmosferik 16:9 looping untuk situs SaaS, fashion, dan DTC — berbranding dan ramah-bisu.

06

Explainer & tutorial

Ubah naskah menjadi sekuens narasi dengan dialog lip-sync dan suara ambient yang serasi.

Bandingkan

Posisi Omni dalam stack video 2026

Dirangkum dari Artificial Analysis, Looksy AI, Oimi AI, dan keynote resmi — untuk orientasi, bukan skor benchmark.

Model Pembuat Arsitektur Audio native Durasi klip
Gemini Omni Omni
Google Omni terpadu (video + gambar + audio) Tersinkron dalam satu pass 5 / 8 / 10 dtk
Veo 3.1
Google Model video spesialis Ya ~8 dtk
Seedance 2.0
ByteDance Video multimodal spesialis Ya hingga 15 dtk / shot
Sora 2
OpenAI Model video spesialis Ya ~20 dtk
Kling V3.0
Kuaishou Model video spesialis Terbatas ~10 dtk
Linimasa

Dari kebocoran pertama hingga panggung I/O 2026

Diurutkan berdasarkan tanggal laporan publik, masih berkembang.

  1. 2026 · 05 · 02

    String "Powered by Omni" pertama

    Pengguna X @Thomas16937378 menemukan "Start with an idea or try a template. Powered by Omni." di tab video Gemini.

  2. 2026 · 05 · 11

    Kartu preview lengkap di Gemini mobile

    TestingCatalog dan Chetaslua mengungkap kartu "Meet our new video model", ID model lengkap, dan batas klip 10 detik.

  3. 2026 · 05 · 12 – 18

    Demo beredar di publik

    Klip "profesor menyelesaikan trigonometri di papan tulis" memamerkan koherensi teks dan kesetiaan fisik, memicu banyak perbandingan dengan Veo 3.1.

  4. 2026 · 05 · 19

    Peluncuran resmi di Google I/O 2026

    Google memperkenalkan Gemini Omni di panggung utama I/O 2026, merilis halaman produk resmi dengan video demo, dan mulai menggantikan Veo 3.1 di dalam aplikasi Gemini.

  5. 2026 · 05 · 19 dst.

    Peluncuran AI Avatar, video-to-video, dan editing multi-giliran

    Peluncuran membawa avatar AI personal, editing video-to-video, dan editing multi-giliran ala chat — dibatasi oleh geografi dan tingkat langganan.

  6. Beberapa minggu ke depan · 2026 · 06+

    API developer dan enterprise melalui Gemini API dan Vertex AI

    Google memastikan akses API untuk developer dan pelanggan enterprise akan hadir "dalam beberapa minggu ke depan" tanpa tanggal pasti. Analis memperkirakan harga sekitar $0,10–$0,30 per detik video.

  7. Di roadmap

    Gemini Omni Pro + output gambar dan audio

    Berikutnya, diharapkan hadir Omni Pro yang lebih kuat, ditambah input audio yang lebih kaya di luar referensi suara dan modalitas output untuk gambar dan audio — menggenapi janji "input apa pun → output apa pun".

FAQ

Pertanyaan yang paling sering ditanyakan tentang Gemini Omni

Apa sebenarnya Gemini Omni?

Model multimodal terpadu Google yang akan datang yang menghasilkan teks, gambar, video, dan audio tersinkron secara native dalam satu arsitektur — secara efektif menggabungkan Veo, Imagen, dan Gemini.

Kapan akan tayang?

Sudah tayang. Google mengumumkan Gemini Omni di panggung utama Google I/O 2026 pada 19 Mei 2026, bersamaan dengan publikasi halaman produk resmi dan video demo.

Bagaimana hubungannya dengan Veo 3.1?

Gemini Omni adalah penerus Veo di dalam aplikasi Gemini — Google secara eksplisit menyatakan Omni "akan menggantikan Veo di aplikasi Gemini". Stack video kini menyatu dengan arsitektur yang sama dengan teks dan gambar Gemini.

Apakah benar-benar menghasilkan suara?

Ya. Suara ambient, skor, dan dialog diproduksi dalam pass yang sama dengan video — itulah alasan utama nama "omni".

Berapa batas durasi klip saat ini?

Halaman produk resmi menyebut klip hingga 10 detik, dengan audio native, hingga 5 referensi foto, dan editing multi-giliran.

Bagaimana skema harganya?

Gemini Omni memerlukan paket Google AI Plus, Pro, atau Ultra dan Anda harus berusia 18+. Beberapa fitur (avatar, editing video-to-video) mungkin dibatasi di negara tertentu.

Apa itu avatar AI Gemini Omni?

Versi digital opsional dari diri Anda yang memungkinkan Gemini menghasilkan video yang terlihat dan terdengar seperti Anda, tanpa perlu mengunggah ulang foto setiap kali — dan hanya Anda yang dapat menggunakan avatar Anda sendiri.