نیٹیو ملٹی موڈل آؤٹ پٹ
ایک ہی پرامپٹ مماثل متن، کی فریمز اور ویڈیو تیار کرتا ہے، اور کردار، اسلوب اور روشنی ہر فارمیٹ میں مستقل رہتی ہے۔
Google I/O 2026 کے مرکزی اسٹیج پر اعلان کیا گیا — Gemini Omni Gemini کی دنیا کی فہم کو نیٹیو ملٹی موڈل جنریشن کے ساتھ ایک ہی فن تعمیر میں جوڑتا ہے: متن، تصویر، ویڈیو اور ہم وقت سازی شدہ آڈیو۔ یہ Gemini ایپ میں Veo 3.1 کی جگہ لے چکا ہے اور اس میں image-to-video، video-to-video ایڈیٹنگ اور ذاتی AI اوتار شامل ہیں۔
ذیل کا ہر کلپ Google کے سرکاری Gemini Omni پروڈکٹ صفحے سے براہ راست ایمبیڈ کیا گیا ہے: text-to-video، image-to-video، اسلوب کی منتقلی، چیٹ ایڈیٹنگ، video-to-video اور AI اوتار — مکمل صلاحیتی سطح۔
تمام ڈیمو ویڈیوز © Google، یہاں صرف معلوماتی تالیف کے لیے استعمال؛ storage.googleapis.com/gweb-gemini-cdn سے براہ راست اسٹریم۔
Gemini Omni کا مرکزی ہیرو ریل: گفتگو سے ویڈیو بنائیں، ری مکس کریں اور ایڈیٹ کریں۔
ایک متن پرامپٹ سے ہم آہنگ ماحول اور کیمرا زبان کے ساتھ ملٹی شاٹ کلپ۔
حوالہ تصاویر اپ لوڈ کریں، Omni حرکت چلاتا ہے، ٹائم لائن خود بخود بھرتا ہے۔
پس منظر، لباس بدلیں یا اسلوب منتقل کریں — آپ کا موضوع اپنی تفصیلات برقرار رکھتا ہے۔
موجودہ فوٹیج کو نئے اسلوب میں — روشنی، لینس حتیٰ کہ مواد بھی پرامپٹ سے دوبارہ تحریر۔
کرداروں کو بدلیں، روشنی ایڈجسٹ کریں، شاٹس کو مستحکم کریں — صرف چیٹ کے ذریعے، دوبارہ تخلیق کی ضرورت نہیں۔
ایک بار AI اوتار سیٹ کریں، پھر ہر مستقبل کے ویڈیو میں تصاویر اپ لوڈ کیے بغیر نظر آئیں۔
Veo، Sora 2، Seedance 2.0 یا Kling جیسے مخصوص ویڈیو ماڈلز کے برعکس، Gemini Omni زبان کے استدلال، تصویر کی پیداوار، ویڈیو کی پیداوار اور آڈیو ترکیب کو ایک ہی فن تعمیر میں رکھتا ہے۔
ایک ہی پرامپٹ مماثل متن، کی فریمز اور ویڈیو تیار کرتا ہے، اور کردار، اسلوب اور روشنی ہر فارمیٹ میں مستقل رہتی ہے۔
مخصوص ماڈلز کی زنجیر بنانے کی ضرورت نہیں۔ متن، تصویر، ویڈیو اور آڈیو ایک ہی وزن اور طویل سیاق و سباق شیئر کرتے ہیں۔
ماحولی آواز، اسکور اور مکالمہ ایک ہی فارورڈ پاس میں تصویر کے ساتھ ترتیب دیے جاتے ہیں — پہلی برآمد میں قدم لے پر پڑتے ہیں اور ہونٹ تقریر سے ملتے ہیں۔
کسی چیز کو بدلیں، روشنی تبدیل کریں، کیمرا کی حرکت قدرتی زبان میں ایڈجسٹ کریں — پوری دوبارہ تخلیق کیے بغیر، Nano Banana کے ایڈیٹنگ انداز میں۔
موجودہ کلپ اپ لوڈ کریں اور پرامپٹ سے اس کی سمت تبدیل کریں۔ حوالہ تصاویر، ویڈیوز اور آڈیو ایک ہی ہدایت میں جمع کیے جا سکتے ہیں۔
پروڈکٹ اشتہارات، Reels، میوزک ویڈیوز اور سینماٹک شارٹس کے لیے بلٹ ان ٹیمپلیٹس داخلے کی رکاوٹ کم کرتے ہیں، کیمرا زبان کو مستقل رکھتے ہیں۔
ذیل کے اعداد و شمار Reddit/X لیکس اور TestingCatalog، Programming Insider، OfficeChai کی رپورٹس سے مرتب کیے گئے ہیں۔
| پہلو | معلوم اشارہ |
|---|---|
| ماڈل فیملی | Google Gemini — Veo سلسلے کا جانشین برانڈ |
| ماڈل ID | bard_eac_video_generation_omni / v3smm-lora-prod |
| کلپ کی لمبائی | فی جنریشن 5 / 8 / 10 سیکنڈ، ایپ میں زنجیر کرنے کے قابل |
| ریزولوشن | 480p / 720p / 1080p |
| تناسب | 16:9, 9:16, 1:1 |
| آڈیو | نیٹیو طور پر ترکیب شدہ، ایک ہی پاس میں سنک |
| ان پٹس | متن / تصویر / ویڈیو / آڈیو حوالہ جات |
| رسائی | 18+ Google AI Plus / Pro / Ultra سبسکرائبرز کے لیے Gemini ایپ میں لائیو |
| کوٹا اشارہ | رپورٹس کے مطابق دو Omni جنریشنز AI Pro کے یومیہ کوٹے کا ~86% استعمال کرتی ہیں |
Google کا جنریٹو اسٹیک پہلے Veo (ویڈیو)، Nano Banana / Imagen (تصویر) اور Gemini (متن) میں منقسم تھا۔ Omni انہیں ایک فن تعمیر میں جمع کرتا ہے۔
پہلے
Veo 3.1
ویڈیو + نیٹیو آڈیو
Nano Banana / Imagen
تصویر کی پیداوار اور ایڈیٹنگ
Gemini 2.5 / 3.x
استدلال · طویل سیاق و سباق
اب · Omni
Gemini Omni
متن · تصویر · ویڈیو · آڈیو، ایک ماڈل، ایک پرامپٹ
طویل سیاق و سباق اور سنک آڈیو والا متحدہ ماڈل یعنی ٹیمیں ایک ہم آہنگ بریف لکھ کر مکمل کٹ کے ساتھ نکل سکتی ہیں۔
ہیرو شاٹس، پیکیجنگ ریوِیل اور لائف اسٹائل کٹس ماحولی آڈیو کے ساتھ تیار۔
9:16 عمودی کلپس، مائیک پر مکالمہ اور بیٹ سنک حرکت کے ساتھ، اسکرول روکنے والا سوشل۔
ایک ٹریک حوالہ دیں اور Omni بیٹ پر مناظر کاٹتا ہے، شاٹس میں کردار مستقل رکھتا ہے۔
متعدد 10 سیکنڈ omni-clips کو ملٹی شاٹ ترتیبوں میں جوڑیں، مسلسل روشنی اور آڈیو بیڈ کے ساتھ۔
SaaS، فیشن اور DTC سائٹس کے لیے لوپ ایبل 16:9 ماحولی کلپس — برانڈڈ اور خاموشی-دوست۔
اسکرپٹ کو لپ سنک مکالمے اور ملتی جلتی ماحولی آواز کے ساتھ سلسلے میں تبدیل کریں۔
Artificial Analysis، Looksy AI، Oimi AI اور سرکاری کی نوٹس سے مرتب — بینچ مارک نہیں، سمت کے لیے۔
| ماڈل | بنانے والا | فن تعمیر | نیٹیو آڈیو | کلپ کی لمبائی |
|---|---|---|---|---|
| Gemini Omni
Omni
| متحدہ omni (ویڈیو + تصویر + آڈیو) | ایک پاس میں سنک | 5 / 8 / 10s | |
| Veo 3.1 | مخصوص ویڈیو ماڈل | ہاں | ~8s | |
| Seedance 2.0 | ByteDance | مخصوص ملٹی موڈل ویڈیو | ہاں | 15s تک / شاٹ |
| Sora 2 | OpenAI | مخصوص ویڈیو ماڈل | ہاں | ~20s |
| Kling V3.0 | Kuaishou | مخصوص ویڈیو ماڈل | محدود | ~10s |
عوامی رپورٹ کی تاریخ کے مطابق، اب بھی ترقی پذیر۔
X صارف @Thomas16937378 نے Gemini ویڈیو ٹیب میں "Start with an idea or try a template. Powered by Omni." دیکھا۔
TestingCatalog اور Chetaslua نے "Meet our new video model" کارڈ، مکمل ماڈل ID اور 10 سیکنڈ کلپ کیپ سامنے لائے۔
"بلیک بورڈ پر مثلثیات حل کرتا پروفیسر" کلپ نے متن کی ہم آہنگی اور طبیعی وفاداری دکھائی، Veo 3.1 سے سخت موازنہ شروع ہوا۔
Google نے I/O 2026 کے مرکزی اسٹیج پر Gemini Omni کا انکشاف کیا، سرکاری پروڈکٹ صفحہ اور ڈیمو ویڈیوز جاری کیے، اور Gemini ایپ میں Veo 3.1 کی جگہ لینا شروع کی۔
اجرا میں ذاتی AI اوتار، video-to-video ایڈیٹنگ اور چیٹ طرز کی ملٹی ٹرن ایڈیٹنگ شامل ہیں — جغرافیہ اور سبسکرپشن کے مطابق۔
Google نے تصدیق کی کہ ڈویلپرز اور انٹرپرائز کسٹمرز کے لیے API رسائی "آنے والے ہفتوں میں" آئے گی، حتمی تاریخ نہیں۔ تجزیہ کار قیمت تقریباً $0.10–$0.30 فی سیکنڈ ویڈیو آؤٹ پٹ بتاتے ہیں۔
اگلے مرحلے میں زیادہ طاقتور Omni Pro متوقع ہے، ساتھ ہی وائس ریفرنس سے آگے بڑھ کر زیادہ بھرپور آڈیو ان پٹس اور تصویر و آڈیو کے آؤٹ پٹ موڈالٹیز شامل ہوں گی — جس سے "کوئی بھی ان پٹ → کوئی بھی آؤٹ پٹ" کا وعدہ مکمل ہوگا۔
یہ Google کا آنے والا متحدہ ملٹی موڈل ماڈل ہے جو ایک ہی فن تعمیر میں متن، تصویر، ویڈیو اور سنک آڈیو نیٹیو طور پر تخلیق کرتا ہے — حقیقتاً Veo، Imagen اور Gemini کا ملاپ۔
پہلے ہی دستیاب ہو چکا ہے۔ Google نے 19 مئی 2026 کو Google I/O 2026 کے مرکزی اسٹیج پر Gemini Omni کا اعلان کیا اور بیک وقت سرکاری پروڈکٹ پیج اور ڈیمو ویڈیوز شائع کیے۔
Gemini ایپ میں Gemini Omni، Veo کا جانشین ہے — Google نے واضح کہا ہے کہ "Omni Gemini ایپ میں Veo کی جگہ لے گا"۔ ویڈیو اسٹیک اب Gemini کے متن اور تصویر کے ساتھ ایک ہی فن تعمیر میں ہے۔
ہاں۔ ماحولی آواز، اسکور اور مکالمہ ویڈیو کے ساتھ اسی پاس میں تخلیق ہوتے ہیں — اسی وجہ سے نام "omni" رکھا گیا ہے۔
سرکاری پروڈکٹ صفحہ 10 سیکنڈ تک کلپ، نیٹیو آڈیو، 5 فوٹو حوالہ جات اور ملٹی ٹرن ایڈیٹنگ کی حمایت کرتا ہے۔
Gemini Omni استعمال کرنے کے لیے Google AI Plus، Pro یا Ultra پلان اور 18+ عمر درکار ہے۔ کچھ خصوصیات (اوتار، video-to-video ایڈیٹنگ) بعض ممالک میں محدود ہو سکتی ہیں۔
یہ آپ کا اختیاری ڈیجیٹل ورژن ہے، ایک بار سیٹ کرنے کے بعد Gemini ہر بار تصاویر اپ لوڈ کیے بغیر آپ جیسا نظر آنے اور بولنے والا ویڈیو بنا سکتا ہے — اور آپ کا اوتار صرف آپ ہی استعمال کر سکتے ہیں۔
اس صفحے کی تمام معلومات نیچے دیے گئے عوامی ذرائع سے مرتب ہیں۔ کراس-ریڈنگ کی سفارش کی جاتی ہے۔
Omni Flash کے اجراء، صلاحیتوں، سطحوں اور رول آؤٹ پلان کی تفصیلات پر مشتمل سرکاری اعلامیہ پوسٹ۔
Gemini Omni، نئے $100 AI Ultra ٹیئر اور دیگر متعلقہ اعلانات کے ساتھ I/O 2026 کا مکمل خلاصہ۔
ڈیمو ویڈیوز، صلاحیت دورہ، سپورٹڈ پلانز اور رول آؤٹ کی تفصیلات کے ساتھ سرکاری اجرا کا صفحہ۔
Omni کس طرح Veo + Imagen اسٹیک کو ایک ہی ماڈل میں ضم کرتا ہے اور ابھی بمقابلہ بعد میں کیا آ رہا ہے، اس پر آزاد تجزیہ کار کا جائزہ۔
لیک تفصیلات، UI سٹرنگز اور ابتدائی ڈیمو تجزیہ۔
مکمل ماڈل ID، ان-ایپ پرامپٹس اور کمیونٹی کے رد عمل۔
تفصیلات، استعمال اور موازنے کا صاف ستھرا خلاصہ۔
فیملی سطح کی ملٹی موڈلیٹی، طویل سیاق و سباق اور ایجنٹک سمت۔