Yerel multimodal çıktı
Tek bir prompt eşleşen metin, anahtar kareler ve video üretir; karakter, stil ve ışık tüm formatlarda tutarlı kalır.
Google I/O 2026 ana sahnesinde duyurulan Gemini Omni, Gemini’nin dünya bilgisini yerel multimodal üretimle tek bir mimaride birleştiriyor — metin, görüntü, video ve senkronize ses. Gemini uygulamasında Veo 3.1’in yerini alıyor; image-to-video, video-to-video düzenleme ve kişisel AI avatarla geliyor.
Aşağıdaki her klip Google’ın resmi Gemini Omni ürün sayfasından doğrudan gömülmüştür: text-to-video, image-to-video, stil aktarımı, sohbet düzenleme, video-to-video ve AI avatar — tüm yetenek yüzeyi.
Tüm demo videoları © Google, burada yalnızca bilgi derleme amacıyla kullanılmıştır; storage.googleapis.com/gweb-gemini-cdn’den doğrudan yayınlanır.
Gemini Omni’nin ana hero reel’ı: sohbet üzerinden video üretin, remiksleyin ve düzenleyin.
Tek bir metin promptu, tutarlı ortam ve kamera diliyle çok planlı bir klip üretir.
Referans görüntüleri yükleyin; Omni hareketi sürer, zaman çizelgesini otomatik doldurur.
Arka planı, kıyafeti değiştirin ya da stili aktarın — konunuz detaylarını korur.
Mevcut bir çekimi yeni bir stilde yeniden döküm — ışık, lens hatta malzeme prompt ile yeniden yazılır.
Karakterleri yeniden seçin, ışığı ayarlayın, çekimleri sabitleyin — yalnızca sohbetle, yeniden üretim olmadan.
Bir kez AI avatar kurun; sonra her videoda fotoğraf yüklemeden başrolde olun.
Veo, Sora 2, Seedance 2.0 ya da Kling gibi uzmanlaşmış video modellerinin aksine Gemini Omni dil mantığı, görüntü üretimi, video üretimi ve ses sentezini aynı mimaride tutuyor.
Tek bir prompt eşleşen metin, anahtar kareler ve video üretir; karakter, stil ve ışık tüm formatlarda tutarlı kalır.
Artık uzman modelleri zincirlemeye gerek yok. Metin, görüntü, video ve ses aynı ağırlıkları ve uzun bağlamı paylaşır.
Ortam sesi, müzik ve diyalog aynı forward pass içinde görüntüyle hizalanır — ilk dışa aktarımda ayak sesleri ritme oturur, dudaklar konuşmayla eşleşir.
Bir nesneyi değiştir, ışığı değiştir, kamera hareketini doğal dille ayarla — tam yeniden üretim olmadan, Nano Banana düzenleme tarzında.
Mevcut bir klibi yükleyip prompt ile yönünü değiştir. Referans görüntüler, videolar ve ses tek bir talimatta birleştirilebilir.
Ürün reklamları, Reels, müzik videoları ve sinematik kısa filmler için hazır şablonlar yeni başlayanların önündeki bariyeri düşürürken kamera dilini tutarlı tutar.
Aşağıdaki sayılar Reddit/X sızıntıları ve TestingCatalog, Programming Insider, OfficeChai gibi haberlerden derlendi.
| Boyut | Bilinen sinyal |
|---|---|
| Model ailesi | Google Gemini — Veo serisinin halefi marka |
| Model ID | bard_eac_video_generation_omni / v3smm-lora-prod |
| Klip uzunluğu | Üretim başına 5 / 8 / 10 saniye, uygulama içinde zincirlenebilir |
| Çözünürlük | 480p / 720p / 1080p |
| En-boy oranları | 16:9, 9:16, 1:1 |
| Ses | Yerel olarak sentezleniyor, tek pas içinde senkronize |
| Girdiler | Metin / görüntü / video / ses referansları |
| Erişim | 18+ Google AI Plus / Pro / Ultra aboneleri için Gemini uygulamasında canlı |
| Kota sinyali | Raporlara göre iki Omni üretimi AI Pro günlük kotasının yaklaşık %86’sını yakıyor |
Google’ın üretken yığını eskiden Veo (video), Nano Banana / Imagen (görüntü) ve Gemini (metin) olarak ayrıydı. Omni bunları tek bir mimaride topluyor.
Önce
Veo 3.1
Video + yerel ses
Nano Banana / Imagen
Görüntü üretimi ve düzenleme
Gemini 2.5 / 3.x
Akıl yürütme · uzun bağlam
Şimdi · Omni
Gemini Omni
Metin · görüntü · video · ses, tek model, tek prompt
Uzun bağlam ve senkron ses ile birleşik model, ekiplerin tek bir tutarlı brief yazıp bitmiş kurguyla çıkmasını sağlar.
Hero shotlar, ambalaj tanıtımları ve lifestyle kurgular, ortam sesi sabitlenmiş halde teslim edilir.
9:16 dikey klipler, mikrofon diyalogu ve ritme uygun hareket — scroll durduran sosyal içerik.
Bir parçayı referans verin; Omni görüntüleri ritmde keser, karakter tutarlılığını korur.
Birden fazla 10 saniyelik omni-clip’i çok planlı sekanslara zincirleyin; ışık ve ses yatağı sürer.
SaaS, moda ve DTC siteleri için loop edilebilir 16:9 atmosfer klipleri — markalı ve sessize-uyumlu.
Senaryoyu dudak senkronlu anlatım ve uyumlu ortam sesleriyle sekansa dönüştürün.
Artificial Analysis, Looksy AI, Oimi AI ve resmi sunumlardan derlendi — yön bulmak için, benchmark değil.
| Model | Geliştirici | Mimari | Yerel ses | Klip uzunluğu |
|---|---|---|---|---|
| Gemini Omni
Omni
| Birleşik omni (video + görüntü + ses) | Tek pas içinde senkron | 5 / 8 / 10s | |
| Veo 3.1 | Uzman video modeli | Var | ~8s | |
| Seedance 2.0 | ByteDance | Uzman multimodal video | Var | plan başına 15s’ye kadar |
| Sora 2 | OpenAI | Uzman video modeli | Var | ~20s |
| Kling V3.0 | Kuaishou | Uzman video modeli | Sınırlı | ~10s |
Kamuya duyurulma tarihine göre sıralı, hâlâ güncellenmekte.
X kullanıcısı @Thomas16937378, Gemini video sekmesinde "Start with an idea or try a template. Powered by Omni." satırını fark etti.
TestingCatalog ve Chetaslua "Meet our new video model" kartı, tam model ID ve 10 saniye sınırı ortaya koydu.
"Karatahtada trigonometri çözen profesör" klibi metin tutarlılığını ve fiziksel sadakati gösterdi; Veo 3.1 ile yoğun karşılaştırma başladı.
Google, I/O 2026 ana sahnesinde Gemini Omni’yi tanıttı; resmi ürün sayfası ve demo videolarını yayınladı; Gemini uygulamasında Veo 3.1’i değiştirmeye başladı.
Lansman kişisel AI avatar, video-to-video düzenleme ve sohbet tarzı çok turlu düzenlemeyi içerir — coğrafya ve abonelik düzeyine göre.
Google, geliştiriciler ve kurumsal müşteriler için API erişiminin "önümüzdeki haftalarda" geleceğini, kesin tarih olmadığını doğruladı. Analistler video çıkışı saniyesinin 0,10–0,30 $ aralığında olacağını tahmin ediyor.
Sırada daha güçlü bir Omni Pro bekleniyor; ses referanslarının ötesinde daha zengin ses girişleri ile görüntü ve ses için çıkış modaliteleri de gelerek "her giriş → her çıkış" vaadini tamamlayacak.
Google’ın yakında gelecek birleşik multimodal modeli; tek mimaride metin, görüntü, video ve senkron ses üretir — özünde Veo, Imagen ve Gemini’yi birleştirir.
Çoktan çıktı. Google, 19 Mayıs 2026’da Google I/O 2026 ana sahnesinde Gemini Omni’yi duyurdu ve aynı anda resmi ürün sayfasıyla demo videolarını yayımladı.
Gemini Omni, Gemini uygulamasında Veo’nun halefidir — Google "Omni Gemini uygulamasında Veo’nun yerini alacak" dedi. Video yığını artık Gemini metin ve görüntüsüyle aynı mimaride.
Evet. Ortam sesi, müzik ve diyalog video ile aynı pas içinde üretilir — "omni" adının nedeni de bu.
Resmi ürün sayfası 10 saniyeye kadar klip, yerel ses, 5’e kadar fotoğraf referansı ve çok turlu düzenleme belirtiyor.
Gemini Omni için Google AI Plus, Pro veya Ultra planı ve 18+ yaş gerekiyor. Bazı özellikler (avatar, video-to-video düzenleme) bazı ülkelerde sınırlı olabilir.
Opsiyonel dijital ikiziniz. Bir kez kurun, sonra her seferinde fotoğraf yüklemeden size benzeyen ve sizin sesinizle konuşan videolar üretebilirsiniz; avatarınızı yalnızca siz kullanabilirsiniz.
Bu sayfadaki tüm içerik aşağıdaki kamu kaynaklarından derlenmiştir. Çapraz okuma önerilir.
Omni Flash lansmanı, yetenekler, yüzeyler ve dağıtım planını anlatan resmi duyuru yazısı.
Gemini Omni, yeni 100 $ AI Ultra paketi ve çevresel duyuruları içeren tam I/O 2026 özeti.
Demo videoları, yetenek turu, desteklenen planlar ve kullanıma sunma detaylarıyla resmi lansman sayfası.
Omni'nin Veo + Imagen yığınını tek bir modelde nasıl birleştirdiğine ve şu an vs. sonra neyin geldiğine dair bağımsız analist özeti.
Sızıntı detayları, UI metinleri ve erken demo analizi.
Tam model ID, uygulama içi promptlar ve topluluk tepkileri.
Spesifikasyon, kullanım ve karşılaştırma özetinin derli toplu hali.
Aile düzeyinde multimodallik, uzun bağlam ve ajan tabanlı yön.