Gemini Omni
لائیو · Gemini ایپ میں Veo کی جگہ

Gemini Omni
بولیے۔ دیکھیے۔ شیئر کیجیے۔

Google I/O 2026 کے مرکزی اسٹیج پر اعلان کیا گیا — Gemini Omni Gemini کی دنیا کی فہم کو نیٹیو ملٹی موڈل جنریشن کے ساتھ ایک ہی فن تعمیر میں جوڑتا ہے: متن، تصویر، ویڈیو اور ہم وقت سازی شدہ آڈیو۔ یہ Gemini ایپ میں Veo 3.1 کی جگہ لے چکا ہے اور اس میں image-to-video، video-to-video ایڈیٹنگ اور ذاتی AI اوتار شامل ہیں۔

متحدہ ماڈل سنک آڈیو چیٹ میں ایڈیٹنگ
Omni
Text
Image
Video
Audio

فوری اعدادوشمار

5–10 سیکنڈ کلپ کی لمبائی
1080p زیادہ سے زیادہ آؤٹ پٹ
16:9 · 9:16 · 1:1 تناسب
I/O 2026 متوقع اعلان
سرکاری ڈیمو

دیکھیں Gemini Omni حقیقت میں کیا تیار کرتا ہے

ذیل کا ہر کلپ Google کے سرکاری Gemini Omni پروڈکٹ صفحے سے براہ راست ایمبیڈ کیا گیا ہے: text-to-video، image-to-video، اسلوب کی منتقلی، چیٹ ایڈیٹنگ، video-to-video اور AI اوتار — مکمل صلاحیتی سطح۔

تمام ڈیمو ویڈیوز © Google، یہاں صرف معلوماتی تالیف کے لیے استعمال؛ storage.googleapis.com/gweb-gemini-cdn سے براہ راست اسٹریم۔

Speak it. See it. Share it.

Gemini Omni کا مرکزی ہیرو ریل: گفتگو سے ویڈیو بنائیں، ری مکس کریں اور ایڈیٹ کریں۔

سرکاری صفحہ دیکھیں
متن → ویڈیو

کہانی میں قدم رکھیں

ایک متن پرامپٹ سے ہم آہنگ ماحول اور کیمرا زبان کے ساتھ ملٹی شاٹ کلپ۔

تصویر → ویڈیو

تصاویر میں جان ڈالیں

حوالہ تصاویر اپ لوڈ کریں، Omni حرکت چلاتا ہے، ٹائم لائن خود بخود بھرتا ہے۔

اسلوب · ٹیمپلیٹ

شاٹ کی روح برقرار رکھیں

پس منظر، لباس بدلیں یا اسلوب منتقل کریں — آپ کا موضوع اپنی تفصیلات برقرار رکھتا ہے۔

ویڈیو → ویڈیو

موجودہ کلپ ری مکس کریں

موجودہ فوٹیج کو نئے اسلوب میں — روشنی، لینس حتیٰ کہ مواد بھی پرامپٹ سے دوبارہ تحریر۔

چیٹ ایڈیٹنگ

آسان ایڈیٹنگ

کرداروں کو بدلیں، روشنی ایڈجسٹ کریں، شاٹس کو مستحکم کریں — صرف چیٹ کے ذریعے، دوبارہ تخلیق کی ضرورت نہیں۔

AI اوتار

اپنے شو کے ستارہ

ایک بار AI اوتار سیٹ کریں، پھر ہر مستقبل کے ویڈیو میں تصاویر اپ لوڈ کیے بغیر نظر آئیں۔

صلاحیتیں

پوری پائپ لائن ایک ماڈل میں سمٹ جاتی ہے

Veo، Sora 2، Seedance 2.0 یا Kling جیسے مخصوص ویڈیو ماڈلز کے برعکس، Gemini Omni زبان کے استدلال، تصویر کی پیداوار، ویڈیو کی پیداوار اور آڈیو ترکیب کو ایک ہی فن تعمیر میں رکھتا ہے۔

نیٹیو ملٹی موڈل آؤٹ پٹ

ایک ہی پرامپٹ مماثل متن، کی فریمز اور ویڈیو تیار کرتا ہے، اور کردار، اسلوب اور روشنی ہر فارمیٹ میں مستقل رہتی ہے۔

متحدہ Gemini اسٹیک

مخصوص ماڈلز کی زنجیر بنانے کی ضرورت نہیں۔ متن، تصویر، ویڈیو اور آڈیو ایک ہی وزن اور طویل سیاق و سباق شیئر کرتے ہیں۔

ہم وقت سازی شدہ نیٹیو آڈیو

ماحولی آواز، اسکور اور مکالمہ ایک ہی فارورڈ پاس میں تصویر کے ساتھ ترتیب دیے جاتے ہیں — پہلی برآمد میں قدم لے پر پڑتے ہیں اور ہونٹ تقریر سے ملتے ہیں۔

چیٹ میں براہ راست ایڈیٹنگ

کسی چیز کو بدلیں، روشنی تبدیل کریں، کیمرا کی حرکت قدرتی زبان میں ایڈجسٹ کریں — پوری دوبارہ تخلیق کیے بغیر، Nano Banana کے ایڈیٹنگ انداز میں۔

ری مکس اور رہنمائی

موجودہ کلپ اپ لوڈ کریں اور پرامپٹ سے اس کی سمت تبدیل کریں۔ حوالہ تصاویر، ویڈیوز اور آڈیو ایک ہی ہدایت میں جمع کیے جا سکتے ہیں۔

ٹیمپلیٹس اور اسلوب

پروڈکٹ اشتہارات، Reels، میوزک ویڈیوز اور سینماٹک شارٹس کے لیے بلٹ ان ٹیمپلیٹس داخلے کی رکاوٹ کم کرتے ہیں، کیمرا زبان کو مستقل رکھتے ہیں۔

تفصیلات

کی نوٹ سے پہلے کیا معلوم ہے

ذیل کے اعداد و شمار Reddit/X لیکس اور TestingCatalog، Programming Insider، OfficeChai کی رپورٹس سے مرتب کیے گئے ہیں۔

پہلو معلوم اشارہ
ماڈل فیملی Google Gemini — Veo سلسلے کا جانشین برانڈ
ماڈل ID bard_eac_video_generation_omni / v3smm-lora-prod
کلپ کی لمبائی فی جنریشن 5 / 8 / 10 سیکنڈ، ایپ میں زنجیر کرنے کے قابل
ریزولوشن 480p / 720p / 1080p
تناسب 16:9, 9:16, 1:1
آڈیو نیٹیو طور پر ترکیب شدہ، ایک ہی پاس میں سنک
ان پٹس متن / تصویر / ویڈیو / آڈیو حوالہ جات
رسائی 18+ Google AI Plus / Pro / Ultra سبسکرائبرز کے لیے Gemini ایپ میں لائیو
کوٹا اشارہ رپورٹس کے مطابق دو Omni جنریشنز AI Pro کے یومیہ کوٹے کا ~86% استعمال کرتی ہیں
فن تعمیر

تین پروڈکٹ لائنیں ایک Omni میں سمٹ جاتی ہیں

Google کا جنریٹو اسٹیک پہلے Veo (ویڈیو)، Nano Banana / Imagen (تصویر) اور Gemini (متن) میں منقسم تھا۔ Omni انہیں ایک فن تعمیر میں جمع کرتا ہے۔

پہلے

Veo 3.1

ویڈیو + نیٹیو آڈیو

Nano Banana / Imagen

تصویر کی پیداوار اور ایڈیٹنگ

Gemini 2.5 / 3.x

استدلال · طویل سیاق و سباق

اب · Omni

Gemini Omni

متن · تصویر · ویڈیو · آڈیو، ایک ماڈل، ایک پرامپٹ

Text Image Video Audio
استعمالات

ایک بریف سے شائع کرنے کے قابل مواد تک

طویل سیاق و سباق اور سنک آڈیو والا متحدہ ماڈل یعنی ٹیمیں ایک ہم آہنگ بریف لکھ کر مکمل کٹ کے ساتھ نکل سکتی ہیں۔

01

پروڈکٹ اشتہارات

ہیرو شاٹس، پیکیجنگ ریوِیل اور لائف اسٹائل کٹس ماحولی آڈیو کے ساتھ تیار۔

02

Reels اور Shorts

9:16 عمودی کلپس، مائیک پر مکالمہ اور بیٹ سنک حرکت کے ساتھ، اسکرول روکنے والا سوشل۔

03

میوزک ویڈیوز

ایک ٹریک حوالہ دیں اور Omni بیٹ پر مناظر کاٹتا ہے، شاٹس میں کردار مستقل رکھتا ہے۔

04

سینماٹک شارٹس

متعدد 10 سیکنڈ omni-clips کو ملٹی شاٹ ترتیبوں میں جوڑیں، مسلسل روشنی اور آڈیو بیڈ کے ساتھ۔

05

لینڈنگ پیج ہیرو لوپ

SaaS، فیشن اور DTC سائٹس کے لیے لوپ ایبل 16:9 ماحولی کلپس — برانڈڈ اور خاموشی-دوست۔

06

وضاحت اور ٹیوٹوریلز

اسکرپٹ کو لپ سنک مکالمے اور ملتی جلتی ماحولی آواز کے ساتھ سلسلے میں تبدیل کریں۔

موازنہ

2026 کے ویڈیو اسٹیک میں Omni کا مقام

Artificial Analysis، Looksy AI، Oimi AI اور سرکاری کی نوٹس سے مرتب — بینچ مارک نہیں، سمت کے لیے۔

ماڈل بنانے والا فن تعمیر نیٹیو آڈیو کلپ کی لمبائی
Gemini Omni Omni
Google متحدہ omni (ویڈیو + تصویر + آڈیو) ایک پاس میں سنک 5 / 8 / 10s
Veo 3.1
Google مخصوص ویڈیو ماڈل ہاں ~8s
Seedance 2.0
ByteDance مخصوص ملٹی موڈل ویڈیو ہاں 15s تک / شاٹ
Sora 2
OpenAI مخصوص ویڈیو ماڈل ہاں ~20s
Kling V3.0
Kuaishou مخصوص ویڈیو ماڈل محدود ~10s
ٹائم لائن

پہلی لیک سے I/O 2026 کے اسٹیج تک

عوامی رپورٹ کی تاریخ کے مطابق، اب بھی ترقی پذیر۔

  1. 2026 · 05 · 02

    پہلی "Powered by Omni" سٹرنگ

    X صارف @Thomas16937378 نے Gemini ویڈیو ٹیب میں "Start with an idea or try a template. Powered by Omni." دیکھا۔

  2. 2026 · 05 · 11

    Gemini موبائل میں مکمل پیش نظارہ کارڈ

    TestingCatalog اور Chetaslua نے "Meet our new video model" کارڈ، مکمل ماڈل ID اور 10 سیکنڈ کلپ کیپ سامنے لائے۔

  3. 2026 · 05 · 12 – 18

    ڈیمو پھیلے

    "بلیک بورڈ پر مثلثیات حل کرتا پروفیسر" کلپ نے متن کی ہم آہنگی اور طبیعی وفاداری دکھائی، Veo 3.1 سے سخت موازنہ شروع ہوا۔

  4. 2026 · 05 · 19

    Google I/O 2026 میں سرکاری اجرا

    Google نے I/O 2026 کے مرکزی اسٹیج پر Gemini Omni کا انکشاف کیا، سرکاری پروڈکٹ صفحہ اور ڈیمو ویڈیوز جاری کیے، اور Gemini ایپ میں Veo 3.1 کی جگہ لینا شروع کی۔

  5. 2026 · 05 · 19 سے

    AI Avatar، video-to-video اور ملٹی ٹرن ایڈیٹنگ کا اجرا

    اجرا میں ذاتی AI اوتار، video-to-video ایڈیٹنگ اور چیٹ طرز کی ملٹی ٹرن ایڈیٹنگ شامل ہیں — جغرافیہ اور سبسکرپشن کے مطابق۔

  6. آنے والے ہفتے · 2026 · 06+

    Gemini API اور Vertex AI کے ذریعے ڈویلپر اور انٹرپرائز API

    Google نے تصدیق کی کہ ڈویلپرز اور انٹرپرائز کسٹمرز کے لیے API رسائی "آنے والے ہفتوں میں" آئے گی، حتمی تاریخ نہیں۔ تجزیہ کار قیمت تقریباً $0.10–$0.30 فی سیکنڈ ویڈیو آؤٹ پٹ بتاتے ہیں۔

  7. روڈ میپ پر

    Gemini Omni Pro اور تصویر و آڈیو آؤٹ پٹس

    اگلے مرحلے میں زیادہ طاقتور Omni Pro متوقع ہے، ساتھ ہی وائس ریفرنس سے آگے بڑھ کر زیادہ بھرپور آڈیو ان پٹس اور تصویر و آڈیو کے آؤٹ پٹ موڈالٹیز شامل ہوں گی — جس سے "کوئی بھی ان پٹ → کوئی بھی آؤٹ پٹ" کا وعدہ مکمل ہوگا۔

اکثر پوچھے گئے سوالات

Gemini Omni کے بارے میں سب سے زیادہ پوچھے گئے سوالات

Gemini Omni آخر کیا ہے؟

یہ Google کا آنے والا متحدہ ملٹی موڈل ماڈل ہے جو ایک ہی فن تعمیر میں متن، تصویر، ویڈیو اور سنک آڈیو نیٹیو طور پر تخلیق کرتا ہے — حقیقتاً Veo، Imagen اور Gemini کا ملاپ۔

کب دستیاب ہوگا؟

پہلے ہی دستیاب ہو چکا ہے۔ Google نے 19 مئی 2026 کو Google I/O 2026 کے مرکزی اسٹیج پر Gemini Omni کا اعلان کیا اور بیک وقت سرکاری پروڈکٹ پیج اور ڈیمو ویڈیوز شائع کیے۔

Veo 3.1 سے تعلق؟

Gemini ایپ میں Gemini Omni، Veo کا جانشین ہے — Google نے واضح کہا ہے کہ "Omni Gemini ایپ میں Veo کی جگہ لے گا"۔ ویڈیو اسٹیک اب Gemini کے متن اور تصویر کے ساتھ ایک ہی فن تعمیر میں ہے۔

کیا یہ واقعی آواز بھی بناتا ہے؟

ہاں۔ ماحولی آواز، اسکور اور مکالمہ ویڈیو کے ساتھ اسی پاس میں تخلیق ہوتے ہیں — اسی وجہ سے نام "omni" رکھا گیا ہے۔

موجودہ کلپ کی لمبائی کی حد کیا ہے؟

سرکاری پروڈکٹ صفحہ 10 سیکنڈ تک کلپ، نیٹیو آڈیو، 5 فوٹو حوالہ جات اور ملٹی ٹرن ایڈیٹنگ کی حمایت کرتا ہے۔

قیمت کیسی ہوگی؟

Gemini Omni استعمال کرنے کے لیے Google AI Plus، Pro یا Ultra پلان اور 18+ عمر درکار ہے۔ کچھ خصوصیات (اوتار، video-to-video ایڈیٹنگ) بعض ممالک میں محدود ہو سکتی ہیں۔

Gemini Omni AI اوتار کیا ہے؟

یہ آپ کا اختیاری ڈیجیٹل ورژن ہے، ایک بار سیٹ کرنے کے بعد Gemini ہر بار تصاویر اپ لوڈ کیے بغیر آپ جیسا نظر آنے اور بولنے والا ویڈیو بنا سکتا ہے — اور آپ کا اوتار صرف آپ ہی استعمال کر سکتے ہیں۔

ذرائع

بنیادی رپورٹیں اور عوامی لنکس

اس صفحے کی تمام معلومات نیچے دیے گئے عوامی ذرائع سے مرتب ہیں۔ کراس-ریڈنگ کی سفارش کی جاتی ہے۔

blog.google ذریعہ پڑھیں

Google Blog · Gemini Omni کا تعارف

Omni Flash کے اجراء، صلاحیتوں، سطحوں اور رول آؤٹ پلان کی تفصیلات پر مشتمل سرکاری اعلامیہ پوسٹ۔

blog.google ذریعہ پڑھیں

Google Blog · Google I/O 2026 سے 100 باتیں

Gemini Omni، نئے $100 AI Ultra ٹیئر اور دیگر متعلقہ اعلانات کے ساتھ I/O 2026 کا مکمل خلاصہ۔

gemini.google ذریعہ پڑھیں

Google · سرکاری Gemini Omni صفحہ

ڈیمو ویڈیوز، صلاحیت دورہ، سپورٹڈ پلانز اور رول آؤٹ کی تفصیلات کے ساتھ سرکاری اجرا کا صفحہ۔

datacamp.com ذریعہ پڑھیں

DataCamp · Google I/O 2026 کا گہرا جائزہ

Omni کس طرح Veo + Imagen اسٹیک کو ایک ہی ماڈل میں ضم کرتا ہے اور ابھی بمقابلہ بعد میں کیا آ رہا ہے، اس پر آزاد تجزیہ کار کا جائزہ۔

programminginsider.com ذریعہ پڑھیں

TestingCatalog · Programming Insider رپورٹ

لیک تفصیلات، UI سٹرنگز اور ابتدائی ڈیمو تجزیہ۔

officechai.com ذریعہ پڑھیں

OfficeChai · Gemini Omni Spotted

مکمل ماڈل ID، ان-ایپ پرامپٹس اور کمیونٹی کے رد عمل۔

looksyai.in ذریعہ پڑھیں

Looksy AI · Gemini Omni پروڈکٹ صفحہ

تفصیلات، استعمال اور موازنے کا صاف ستھرا خلاصہ۔

storage.googleapis.com ذریعہ پڑھیں

Gemini 2.5 تکنیکی رپورٹ

فیملی سطح کی ملٹی موڈلیٹی، طویل سیاق و سباق اور ایجنٹک سمت۔