إخراج متعدد الوسائط أصيل
موجِّه واحد يُنتج نصًا و keyframes وفيديو متناسقًا، مع شخصيات وأسلوب وإضاءة متّسقة عبر الصيغ.
أُعلن عنه على المسرح الرئيسي لمؤتمر Google I/O 2026، يدمج Gemini Omni فهم Gemini للعالم مع التوليد متعدد الوسائط الأصيل — نصّ وصورة وفيديو وصوت متزامن في بنية واحدة. يحلّ الآن محل Veo 3.1 داخل تطبيق Gemini ويأتي مع image-to-video وتحرير video-to-video وأڤاتار شخصي بالذكاء الاصطناعي.
كل مقطع أدناه مضمّن مباشرة من صفحة منتج Gemini Omni الرسمية من Google: text-to-video و image-to-video ونقل الأسلوب وتحرير الدردشة و video-to-video وأڤاتار AI — كامل سطح القدرات.
جميع فيديوهات العرض © Google، تُستخدم هنا لأغراض تجميع المعلومات؛ تُبَث مباشرة من storage.googleapis.com/gweb-gemini-cdn.
الريل الرئيسي لـ Gemini Omni: ابتكر وأعد المزج وحرّر الفيديو بالمحادثة.
موجِّه نصي واحد يُنتج مقطعًا متعدد اللقطات ببيئة ولغة كاميرا متّسقة.
ارفع صور مرجعية ليقود Omni الحركة ويملأ الخط الزمني تلقائيًا.
بدّل الخلفيات وغيّر الملابس وانقل الأنماط — يحتفظ شخصك بتفاصيله.
أعد صياغة لقطات موجودة بأسلوب جديد — إضاءة، عدسة، حتى مادة، تُعاد كتابتها بالموجِّه.
أعد توزيع الشخصيات واضبط الإضاءة وثبّت اللقطات — كل ذلك عبر المحادثة، دون إعادة توليد.
أنشِئ أڤاتار AI مرة واحدة، ثم تألّق في كل فيديو مستقبلي دون إعادة رفع الصور.
بخلاف نماذج الفيديو المتخصّصة مثل Veo و Sora 2 و Seedance 2.0 و Kling، يبقي Gemini Omni الاستدلال اللغوي وتوليد الصور والفيديو وتأليف الصوت ضمن بنية واحدة.
موجِّه واحد يُنتج نصًا و keyframes وفيديو متناسقًا، مع شخصيات وأسلوب وإضاءة متّسقة عبر الصيغ.
لا مزيد من ربط نماذج متخصّصة بسلاسل. النص والصورة والفيديو والصوت تتشارك الأوزان والسياق الطويل ذاته.
الأصوات المحيطة والموسيقى والحوار تتطابق مع الصورة في تمريرة أمامية واحدة — خطوات تتزامن مع الإيقاع، وشفاه تطابق الكلام منذ التصدير الأول.
استبدل عنصرًا أو غيّر الإضاءة أو اضبط حركة الكاميرا بلغة طبيعية — دون إعادة توليد كامل، تكرارًا لطريقة Nano Banana.
ارفع مقطعًا موجودًا وأعِد توجيهه بالموجّهات. صور وفيديوهات وصوتيات مرجعية تُدمج في تعليمة واحدة.
قوالب جاهزة لإعلانات المنتجات و Reels والفيديوهات الموسيقية والأفلام القصيرة السينمائية تخفض حاجز الدخول للمبتدئين مع الحفاظ على لغة الكاميرا متّسقة.
الأرقام أدناه مجمّعة من تسريبات Reddit / X وتقارير TestingCatalog و Programming Insider و OfficeChai.
| البُعد | الإشارة المعروفة |
|---|---|
| عائلة النموذج | Google Gemini — وريث علامة سلسلة Veo |
| Model ID | bard_eac_video_generation_omni / v3smm-lora-prod |
| مدة المقطع | 5 / 8 / 10 ثوانٍ لكل توليد، قابلة للسلسلة داخل التطبيق |
| الدقّة | 480p / 720p / 1080p |
| نسب الأبعاد | 16:9, 9:16, 1:1 |
| الصوت | مُؤلَّف أصيل، متزامن في تمريرة واحدة |
| المدخلات | مراجع نص / صورة / فيديو / صوت |
| الوصول | متاح داخل تطبيق Gemini لمشتركي Google AI Plus / Pro / Ultra (18+) |
| مؤشر الحصة | تقارير تشير إلى أن توليدَين من Omni يستهلكان ~86% من حصة AI Pro اليومية |
كان stack Google التوليدي مقسّمًا سابقًا: Veo للفيديو، Nano Banana / Imagen للصور، و Gemini للنص. يلفّ Omni كل ذلك في بنية واحدة.
قبل
Veo 3.1
فيديو + صوت أصيل
Nano Banana / Imagen
توليد وتحرير الصور
Gemini 2.5 / 3.x
استدلال · سياق طويل
الآن · Omni
Gemini Omni
نص · صورة · فيديو · صوت، نموذج واحد، موجِّه واحد
نموذج موحّد بسياق طويل وصوت متزامن يعني أنّ الفِرَق تكتب ملخصًا متّسقًا واحدًا وتغادر بمونتاج جاهز.
لقطات افتتاحية وكشف عبوات ومشاهد نمط حياة تصدر مع صوت محيط محسوم.
مقاطع رأسية 9:16 بحوار مباشر وحركة متزامنة مع الإيقاع، صُمِّمت لإيقاف التمرير.
استشهد بمسار صوتي ليقطع Omni الصور على الإيقاع، مع الحفاظ على شخصية ثابتة عبر اللقطات.
اربط عدة omni-clips من 10 ثوان في تتابع متعدد اللقطات مع إضاءة وطبقة صوت مستمرة.
مقاطع جوّ 16:9 قابلة للتكرار لمواقع SaaS والأزياء و DTC — مع علامة تجارية وصديقة للصمت.
حوِّل سيناريو إلى تتابع مرويّ بحوار متزامن الشفاه وصوت محيط متناسق.
مجمّع من Artificial Analysis و Looksy AI و Oimi AI والكلمات الرسمية — للتوجيه، وليس درجات benchmark.
| النموذج | المُنشئ | البنية | صوت أصيل | مدة المقطع |
|---|---|---|---|---|
| Gemini Omni
Omni
| Omni موحّد (فيديو + صورة + صوت) | متزامن في تمريرة واحدة | 5 / 8 / 10 ث | |
| Veo 3.1 | نموذج فيديو متخصّص | نعم | ~8 ث | |
| Seedance 2.0 | ByteDance | فيديو متعدد الوسائط متخصّص | نعم | حتى 15 ث / لقطة |
| Sora 2 | OpenAI | نموذج فيديو متخصّص | نعم | ~20 ث |
| Kling V3.0 | Kuaishou | نموذج فيديو متخصّص | محدود | ~10 ث |
مرتّب حسب تاريخ التقرير العلني، ولا يزال يتطوّر.
رصد مستخدم X بحساب @Thomas16937378 العبارة "Start with an idea or try a template. Powered by Omni." داخل تبويب فيديو Gemini.
أبرز TestingCatalog و Chetaslua بطاقة "Meet our new video model" مع Model ID كامل وسقف مقطع 10 ثوانٍ.
مقطع "بروفيسور يحلّ مثلثات على سبورة" أبرز اتساق النص ودقّة الفيزياء، مما أشعل المقارنات مع Veo 3.1.
كشفت Google عن Gemini Omni على المسرح الرئيسي لـ I/O 2026، وأطلقت صفحة المنتج الرسمية مع فيديوهات تجريبية، وبدأت استبدال Veo 3.1 داخل تطبيق Gemini.
الإطلاق يأتي مع أڤاتار AI شخصي وتحرير video-to-video وتحرير بأسلوب الدردشة متعدد الأدوار — مع قيود حسب المنطقة الجغرافية والاشتراك.
أكدت Google أن الوصول إلى الـ API للمطورين والشركات قادم "خلال الأسابيع القادمة" دون تاريخ محدد. ويقدّر المحللون السعر بنحو 0.10–0.30 دولار لكل ثانية من إخراج الفيديو.
يُتوقع أن يأتي بعد ذلك Omni Pro أكثر قدرة، إلى جانب مدخلات صوتية أغنى تتجاوز المراجع الصوتية، وأنماط إخراج للصورة والصوت — لتكتمل بذلك وعد "أي إدخال → أي إخراج".
هو نموذج Google متعدد الوسائط الموحّد القادم، يُولِّد نصًا وصورة وفيديو وصوتًا متزامنًا أصيلًا داخل بنية واحدة — موحّدًا فعليًا بين Veo و Imagen و Gemini.
صدر بالفعل. أعلنت Google عن Gemini Omni على المسرح الرئيسي لمؤتمر Google I/O 2026 في 19 مايو 2026، مع نشر صفحة المنتج الرسمية وفيديوهات تجريبية في الوقت ذاته.
Gemini Omni هو خليفة Veo داخل تطبيق Gemini — تقول Google صراحةً إن Omni "سيحلّ محل Veo في تطبيق Gemini". stack الفيديو الآن مطوي في البنية ذاتها مع نص وصور Gemini.
نعم. الأصوات المحيطة والموسيقى والحوار تُنتَج في التمريرة ذاتها مع الفيديو — وهذا سبب اسم "omni".
تذكر صفحة المنتج الرسمية مقاطع حتى 10 ثوانٍ، مع صوت أصيل، وحتى 5 مراجع صور وتحرير متعدد الأدوار.
يتطلب Gemini Omni خطّة Google AI Plus أو Pro أو Ultra، ويجب أن يكون عمرك 18+. قد تُقيّد بعض الميزات (الأڤاتار، تحرير video-to-video) في دول معيّنة.
نسخة رقمية اختيارية منك، تتيح لـ Gemini توليد فيديوهات تبدو وتُسمع مثلك دون الحاجة لرفع الصور كل مرة — وأنت وحدك من يستخدم أڤاتارك.
كل ما في هذه الصفحة مجمّع من المصادر العلنية أدناه. القراءة المقارنة مستحسنة.
منشور الإعلان الرسمي الذي يفصّل إطلاق Omni Flash وقدراته وواجهاته وخطة الطرح.
ملخص كامل لمؤتمر I/O 2026 يشمل Gemini Omni، وباقة AI Ultra الجديدة بسعر 100$، والإصدارات المحيطة.
صفحة الإطلاق الرسمية مع فيديوهات تجريبية وجولة قدرات والخطط المدعومة وتفاصيل الطرح.
نظرة عامة من محلل مستقل حول كيفية دمج Omni لمكدسي Veo + Imagen في نموذج واحد، وما المتاح الآن مقابل لاحقًا.
تفاصيل التسريب وسلاسل UI وتحليل الديمو المبكر.
Model ID كامل والمواعِظ داخل التطبيق وردود فعل المجتمع.
ملخص أنيق للمواصفات وحالات الاستخدام والمقارنات.
تعدد الوسائط على مستوى العائلة، السياق الطويل، والاتجاه الوكيلي.