פלט רב-מודאלי נטיבי
פרומפט יחיד מפיק טקסט, keyframes ווידאו תואמים, עם דמויות, סגנון ותאורה עקביים על פני פורמטים.
הוכרז בבמה הראשית של Google I/O 2026, Gemini Omni מאחד את הבנת העולם של Gemini עם יצירה רב-מודאלית נטיבית — טקסט, תמונה, וידאו ואודיו מסונכרן בארכיטקטורה אחת. הוא מחליף כעת את Veo 3.1 בתוך אפליקציית Gemini ומגיע עם image-to-video, עריכה מסוג video-to-video ואווטאר AI אישי.
כל קליפ למטה משובץ ישירות מדף המוצר הרשמי של Gemini Omni של Google: text-to-video, image-to-video, העברת סגנון, עריכה בצ׳אט, video-to-video והאווטאר של AI — מלוא משטח היכולות.
כל סרטוני הדמו © Google, משמשים כאן לצברור מידע; משודרים ישירות מ-storage.googleapis.com/gweb-gemini-cdn.
הריל ההירו הראשי של Gemini Omni: צור, ערוך והכנס רימיקס לסרטונים דרך שיחה.
פרומפט טקסט אחד מייצר קליפ רב-קאטים עם סביבה ושפת מצלמה לכידה.
העלה תמונות הפניה ו-Omni מניע את התנועה, ממלא את ציר הזמן באופן אוטומטי.
החלף רקעים, שנה תלבושת או העבר סגנון — האובייקט שלך שומר על פרטיו.
יציקה מחדש של פוטאז׳ קיים בסגנון חדש — תאורה, עדשה או אפילו חומר נכתבים מחדש על ידי פרומפט.
הקצה מחדש דמויות, התאם תאורה, ייצב קאטים — הכל בצ׳אט, ללא ייצור מחדש.
הקם AI avatar פעם אחת, ולאחר מכן כיכב בכל סרטון עתידי בלי להעלות תמונות מחדש.
בניגוד למודלי וידאו ייעודיים כמו Veo, Sora 2, Seedance 2.0 או Kling, Gemini Omni שומר על הסקת מסקנות בשפה, יצירת תמונות, יצירת וידאו וסינתזת אודיו תחת ארכיטקטורה אחת.
פרומפט יחיד מפיק טקסט, keyframes ווידאו תואמים, עם דמויות, סגנון ותאורה עקביים על פני פורמטים.
אין יותר שרשורי מודלים ייעודיים. טקסט, תמונה, וידאו ואודיו חולקים את אותם משקלים ואותו הקשר ארוך.
צלילי סביבה, פסקול ודיאלוג מיושרים עם התמונה באותו forward pass — צעדים נופלים על המקצב, שפתיים תואמות לדיבור כבר בייצוא הראשון.
החלף אובייקט, שנה תאורה או התאם תנועת מצלמה בשפה טבעית — בלי יצירה מחדש מלאה, בהמשך לדרך של Nano Banana.
העלה קליפ קיים והפנה אותו מחדש עם פרומפטים. תמונות, סרטונים ואודיו רפרנס משולבים בהוראה אחת.
תבניות מובנות לפרסומות מוצר, Reels, וידאו קליפים וקטעים קצרים קולנועיים מנמיכות את הסף למתחילים תוך שמירה על שפת מצלמה עקבית.
המספרים שלהלן מצוברים מהדלפות Reddit/X ומדיווחי TestingCatalog, Programming Insider ו-OfficeChai.
| מימד | אות ידוע |
|---|---|
| משפחת מודל | Google Gemini — יורש המותג של סדרת Veo |
| Model ID | bard_eac_video_generation_omni / v3smm-lora-prod |
| אורך קליפ | 5 / 8 / 10 שניות לכל יצירה, ניתנים לשרשור באפליקציה |
| רזולוציה | 480p / 720p / 1080p |
| יחסי תצוגה | 16:9, 9:16, 1:1 |
| אודיו | סינתזה נטיבית, מסונכרן ב-pass יחיד |
| קלטים | הפניות טקסט / תמונה / וידאו / אודיו |
| גישה | משודר באפליקציית Gemini למנויי Google AI Plus / Pro / Ultra בגילאי 18+ |
| אות מכסה | דיווחים מציינים ששתי יצירות Omni שורפות כ-86% ממכסה יומית של AI Pro |
המחסנית הגנרטיבית של Google הייתה מפוצלת בעבר: Veo לווידאו, Nano Banana / Imagen לתמונות ו-Gemini לטקסט. Omni מגלגל את כולם לארכיטקטורה אחת.
לפני
Veo 3.1
וידאו + אודיו נטיבי
Nano Banana / Imagen
יצירת ועריכת תמונות
Gemini 2.5 / 3.x
הסקה · הקשר ארוך
עכשיו · Omni
Gemini Omni
טקסט · תמונה · וידאו · אודיו, מודל אחד, פרומפט אחד
מודל מאוחד עם הקשר ארוך ואודיו מסונכרן אומר שצוותים יכולים לכתוב בריף קוהרנטי אחד וללכת עם קאט מוכן.
צילומי בכורה, חשיפת אריזות וקאטים של לייפסטייל יוצאים עם אודיו סביבה נעול.
קליפים אנכיים 9:16 עם דיאלוג on-mic ותנועה מסונכרנת לביט, נבנים לעצירת הגלילה.
תייג טראק ו-Omni חותך ויזואל לפי הביט, שומר על דמות עקבית בין קאטים.
חבר כמה omni-clip של 10 שניות לרצף רב-קאטים עם תאורה ושכבת אודיו מתמשכת.
קליפי אווירה 16:9 לולאתיים לאתרי SaaS, אופנה ו-DTC — ממותגים וידידותיים לשתיקה.
הפוך סקריפט לרצף עם קריינות, דיאלוג מסונכרן לשפתיים וצליל סביבה תואם.
מצוברים מ-Artificial Analysis, Looksy AI, Oimi AI והקיינוטים הרשמיים — להתמצאות, לא לציוני benchmark.
| מודל | יוצר | ארכיטקטורה | אודיו נטיבי | אורך קליפ |
|---|---|---|---|---|
| Gemini Omni
Omni
| Omni מאוחד (וידאו + תמונה + אודיו) | מסונכרן ב-pass אחד | 5 / 8 / 10 שנ׳ | |
| Veo 3.1 | מודל וידאו ייעודי | כן | ~8 שנ׳ | |
| Seedance 2.0 | ByteDance | וידאו רב-מודאלי ייעודי | כן | עד 15 שנ׳ / שוט |
| Sora 2 | OpenAI | מודל וידאו ייעודי | כן | ~20 שנ׳ |
| Kling V3.0 | Kuaishou | מודל וידאו ייעודי | מוגבל | ~10 שנ׳ |
מסודר לפי תאריך דיווח פומבי, עדיין מתפתח.
המשתמש @Thomas16937378 ב-X גילה את "Start with an idea or try a template. Powered by Omni." בלשונית הווידאו של Gemini.
TestingCatalog ו-Chetaslua חשפו את כרטיס "Meet our new video model", model ID מלא ותקרת קליפ של 10 שניות.
קליפ "פרופסור פותר טריגונומטריה על לוח" הציג קוהרנטיות טקסט ונאמנות פיזיקלית, מה שיצר השוואות אינטנסיביות עם Veo 3.1.
Google חושפת את Gemini Omni בבמה הראשית של I/O 2026, משחררת דף מוצר רשמי עם וידאו דמו ומתחילה להחליף את Veo 3.1 בתוך אפליקציית Gemini.
ההשקה מגיעה עם אווטאר AI אישי, עריכת video-to-video ועריכה בסגנון צ׳אט מרובת תורות — מוגבלים לפי גיאוגרפיה ושכבת מנוי.
Google אישרה כי גישה ל-API למפתחים וללקוחות ארגוניים תגיע "בשבועות הקרובים" ללא תאריך מדויק. אנליסטים מעריכים מחיר של 0.10$–0.30$ לשנייה של וידאו שמופק.
צפוי בהמשך Omni Pro חזק יותר, יחד עם קלטי אודיו עשירים מעבר לרפרנס קולי, ומודאליות פלט לתמונה ולאודיו — שמשלימים את ההבטחה "כל קלט → כל פלט".
המודל הרב-מודאלי המאוחד הקרוב של Google שמייצר נטיבית טקסט, תמונה, וידאו ואודיו מסונכרן בתוך ארכיטקטורה אחת — מאחד למעשה את Veo, Imagen ו-Gemini.
כבר הושק. Google הכריזה על Gemini Omni בבמה הראשית של Google I/O 2026 ב-19 במאי 2026, במקביל לפרסום דף המוצר הרשמי וסרטוני הדמו.
Gemini Omni הוא היורש של Veo בתוך אפליקציית Gemini — Google אומרת מפורשות ש-Omni "יחליף את Veo באפליקציית Gemini". מחסנית הווידאו מתקפלת כעת לאותה ארכיטקטורה כמו טקסט ותמונה ב-Gemini.
כן. צלילי סביבה, פסקול ודיאלוג מיוצרים באותו pass כמו הווידאו — זו כל הסיבה לשם "omni".
דף המוצר הרשמי מציין קליפים של עד 10 שניות, עם אודיו נטיבי, עד 5 הפניות צילום ועריכה מרובת תורות.
Gemini Omni דורש תוכנית Google AI Plus, Pro או Ultra ועליך להיות מעל גיל 18. תכונות מסוימות (אווטארים, עריכת video-to-video) עשויות להיות מוגבלות במדינות מסוימות.
גרסה דיגיטלית אופציונלית שלך שמאפשרת ל-Gemini ליצור סרטונים שנראים ונשמעים כמוך, ללא צורך להעלות תמונות מחדש בכל פעם — ורק אתה יכול להשתמש באווטאר שלך.
הכל בעמוד הזה מצובר מהמקורות הפומביים שלמטה. מומלצת קריאה משלימה.
פוסט הכרזה רשמי עם פרטי השקת Omni Flash, יכולות, משטחים ותכנית פריסה.
סיכום מלא של I/O 2026 הכולל את Gemini Omni, חבילת AI Ultra החדשה במחיר 100$ והשקות נלוות.
דף ההשקה הרשמי עם סרטוני דמו, סיור יכולות, תוכניות נתמכות ופרטי הפצה.
סקירה של אנליסט עצמאי על האופן בו Omni מאחד את מחסניות Veo + Imagen למודל יחיד, ומה זמין כעת מול בהמשך.
פרטי הדלפה, מחרוזות UI וניתוח דמו מוקדם.
Model ID מלא, פרומפטים תוך-אפליקציה ותגובות הקהילה.
סיכום מסודר של מפרטים, מקרי שימוש והשוואות.
מולטימודאליות ברמת משפחה, הקשר ארוך וכיוון אג׳נטי.