Gemini Omni
เปิดใช้งานแล้ว · แทนที่ Veo ในแอป Gemini

Gemini Omni
พูด มอง แชร์

เปิดตัวบนเวทีหลัก Google I/O 2026 โดย Gemini Omni หลอมรวมความเข้าใจโลกของ Gemini เข้ากับการสร้างเนื้อหาแบบมัลติโมดอลในตัว — ข้อความ ภาพ วิดีโอ และเสียงที่ซิงค์กันในสถาปัตยกรรมเดียว ปัจจุบันแทนที่ Veo 3.1 ภายในแอป Gemini พร้อม image-to-video การแก้ไขแบบ video-to-video และอวาตาร์ AI ส่วนตัว

โมเดลรวม เสียงซิงค์ แก้ไขในแชต
Omni
Text
Image
Video
Audio

สถิติย่อ

5–10 วินาที ความยาวคลิป
1080p เอาต์พุตสูงสุด
16:9 · 9:16 · 1:1 อัตราส่วนภาพ
I/O 2026 คาดว่าจะเปิดตัว
เดโมอย่างเป็นทางการ

ดูว่า Gemini Omni ผลิตอะไรออกมาได้จริง

ทุกคลิปด้านล่างฝังตรงจากหน้าผลิตภัณฑ์ Gemini Omni อย่างเป็นทางการของ Google: text-to-video, image-to-video, การถ่ายทอดสไตล์, การแก้ไขผ่านแชต, video-to-video และ AI avatar — พื้นผิวความสามารถทั้งหมด

วิดีโอเดโมทั้งหมด © Google นำมาใช้ที่นี่เพื่อการรวบรวมข้อมูล สตรีมตรงจาก storage.googleapis.com/gweb-gemini-cdn

พูด มอง แชร์

รีลฮีโร่หลักของ Gemini Omni: สร้าง รีมิกซ์ และแก้ไขวิดีโอผ่านการสนทนา

ดูหน้าทางการ
ข้อความ → วิดีโอ

ก้าวเข้าไปในเรื่อง

พรอมต์ข้อความเดียวสร้างคลิปหลายช็อตด้วยสภาพแวดล้อมและภาษากล้องที่สอดคล้อง

ภาพ → วิดีโอ

ปลุกชีวิตให้รูปถ่าย

อัปโหลดภาพอ้างอิงแล้ว Omni ขับเคลื่อนการเคลื่อนไหวและเติมไทม์ไลน์อัตโนมัติ

สไตล์ · เทมเพลต

รักษาจิตวิญญาณของช็อต

สลับฉาก เปลี่ยนชุด หรือถ่ายทอดสไตล์ — ตัวแบบยังรักษารายละเอียดเอาไว้

วิดีโอ → วิดีโอ

รีมิกซ์คลิปที่มีอยู่

หล่อหลอมฟุตเทจเดิมในสไตล์ใหม่ — แสง เลนส์ หรือแม้แต่วัสดุเขียนใหม่ด้วยพรอมต์

แก้ไขผ่านแชต

แก้ไขง่าย

หล่อใหม่ตัวละคร ปรับแสง รักษาช็อตให้นิ่ง — ทำได้หมดด้วยการแชต ไม่ต้องสร้างใหม่

AI avatar

เป็นดาราในรายการของคุณเอง

ตั้งค่า AI avatar ครั้งเดียว แล้วร่วมแสดงในวิดีโออนาคตทุกครั้งโดยไม่ต้องอัปโหลดรูปใหม่

ความสามารถ

ไปป์ไลน์ทั้งหมดยุบเหลือโมเดลเดียว

ไม่เหมือนกับโมเดลวิดีโอเฉพาะทางอย่าง Veo, Sora 2, Seedance 2.0 หรือ Kling, Gemini Omni เก็บการให้เหตุผลทางภาษา การสร้างภาพ การสร้างวิดีโอ และการสังเคราะห์เสียงไว้ในสถาปัตยกรรมเดียว

เอาต์พุตมัลติโมดอลในตัว

พรอมต์เดียวสร้างข้อความ คีย์เฟรม และวิดีโอที่กลมกลืน โดยตัวละคร สไตล์ และแสงคงเส้นคงวาข้ามฟอร์แมต

สแต็ก Gemini รวมเป็นหนึ่ง

ไม่ต้องต่อโมเดลเฉพาะทางหลายตัวอีกต่อไป ข้อความ ภาพ วิดีโอ และเสียงใช้น้ำหนักเดียวและบริบทยาวเดียวกัน

เสียงในตัวที่ซิงค์

เสียงบรรยากาศ ดนตรี และบทพูดถูกจัดให้ตรงกับภาพในฟอร์เวิร์ดพาสเดียวกัน — เสียงฝีเท้าลงจังหวะ ริมฝีปากตรงคำพูดตั้งแต่เอ็กซ์พอร์ตครั้งแรก

แก้ไขในแชตโดยตรง

สลับวัตถุ เปลี่ยนแสง หรือปรับการเคลื่อนกล้องด้วยภาษาธรรมชาติ — ไม่ต้องสร้างใหม่ทั้งหมด เดินตามรอย Nano Banana

รีมิกซ์และกำหนดทิศทาง

อัปโหลดคลิปที่มีอยู่และเปลี่ยนทิศทางด้วยพรอมต์ ภาพ วิดีโอ และเสียงอ้างอิงผสานได้ในคำสั่งเดียว

เทมเพลตและสไตล์

เทมเพลตในตัวสำหรับโฆษณาสินค้า Reels มิวสิกวิดีโอ และหนังสั้นเชิงภาพยนตร์ ลดเพดานสำหรับผู้ใช้ใหม่ขณะรักษาภาษาภาพให้สอดคล้อง

สเปก

สิ่งที่ปะติดปะต่อได้ก่อนคีย์โน้ต

ตัวเลขด้านล่างรวบรวมจากการรั่วของ Reddit/X และรายงานจาก TestingCatalog, Programming Insider และ OfficeChai

หัวข้อ สัญญาณที่ทราบ
ตระกูลโมเดล Google Gemini — การสืบทอดแบรนด์สาย Veo
Model ID bard_eac_video_generation_omni / v3smm-lora-prod
ความยาวคลิป 5 / 8 / 10 วินาทีต่อการสร้าง ต่อรวมได้ในแอป
ความละเอียด 480p / 720p / 1080p
อัตราส่วน 16:9, 9:16, 1:1
เสียง สังเคราะห์ในตัว ซิงค์ในพาสเดียว
อินพุต อ้างอิงข้อความ / ภาพ / วิดีโอ / เสียง
การเข้าถึง ใช้งานในแอป Gemini สำหรับสมาชิก Google AI Plus / Pro / Ultra อายุ 18 ปีขึ้นไป
สัญญาณโควต้า รายงานระบุว่าการสร้าง Omni สองครั้งกินโควต้ารายวันของ AI Pro ราว 86%
สถาปัตยกรรม

สามสายผลิตภัณฑ์รวมเป็น Omni เดียว

สแต็กเชิงสร้างของ Google เคยแยกเป็น Veo สำหรับวิดีโอ, Nano Banana / Imagen สำหรับภาพ และ Gemini สำหรับข้อความ Omni ม้วนทั้งหมดเข้าสู่สถาปัตยกรรมเดียว

ก่อน

Veo 3.1

วิดีโอ + เสียงในตัว

Nano Banana / Imagen

สร้างและแก้ไขภาพ

Gemini 2.5 / 3.x

การให้เหตุผล · บริบทยาว

ตอนนี้ · Omni

Gemini Omni

ข้อความ · ภาพ · วิดีโอ · เสียง โมเดลเดียว พรอมต์เดียว

Text Image Video Audio
กรณีใช้งาน

จากบรีฟเดียวสู่คอนเทนต์พร้อมเผยแพร่

โมเดลรวมที่มีบริบทยาวและเสียงซิงค์หมายถึงทีมเขียนบรีฟเดียวอย่างกลมกลืนและกลับบ้านพร้อมคัตที่เสร็จสมบูรณ์

01

โฆษณาสินค้า

ฮีโร่ช็อต โชว์แพ็กเกจ และคัตไลฟ์สไตล์ส่งออกพร้อมเสียงบรรยากาศที่ล็อกแล้ว

02

Reels & Shorts

คลิปแนวตั้ง 9:16 พร้อมบทพูดตรงไมค์และมูฟเมนต์ที่ซิงค์จังหวะ เพื่อหยุดนิ้วผู้ชมบนโซเชียล

03

มิวสิกวิดีโอ

อ้างอิงแทร็กแล้วให้ Omni ตัดภาพตามจังหวะ พร้อมรักษาตัวละครให้สอดคล้องตลอด

04

หนังสั้นเชิงภาพยนตร์

ต่อ omni-clip 10 วินาทีหลายตัวเป็นซีเควนซ์หลายช็อตด้วยแสงและชั้นเสียงต่อเนื่อง

05

ฮีโร่ลูปหน้าแลนดิ้ง

คลิปบรรยากาศ 16:9 ลูปได้สำหรับเว็บ SaaS, แฟชั่น และ DTC — มีแบรนด์และเป็นมิตรเมื่อปิดเสียง

06

เอ็กซ์เพลนเนอร์และทูทอเรียล

แปลงสคริปต์เป็นซีเควนซ์มีเสียงบรรยาย ลิปซิงค์และเสียงบรรยากาศที่เข้ากัน

เปรียบเทียบ

ตำแหน่งของ Omni ในสแต็กวิดีโอปี 2026

รวบรวมจาก Artificial Analysis, Looksy AI, Oimi AI และคีย์โน้ตอย่างเป็นทางการ — เพื่อจัดบริบท ไม่ใช่คะแนนเบนช์มาร์ก

โมเดล ผู้สร้าง สถาปัตยกรรม เสียงในตัว ความยาวคลิป
Gemini Omni Omni
Google Omni รวม (วิดีโอ + ภาพ + เสียง) ซิงค์ในพาสเดียว 5 / 8 / 10 วินาที
Veo 3.1
Google โมเดลวิดีโอเฉพาะทาง ใช่ ~8 วินาที
Seedance 2.0
ByteDance โมเดลวิดีโอมัลติโมดอลเฉพาะทาง ใช่ สูงสุด 15 วินาที / ช็อต
Sora 2
OpenAI โมเดลวิดีโอเฉพาะทาง ใช่ ~20 วินาที
Kling V3.0
Kuaishou โมเดลวิดีโอเฉพาะทาง จำกัด ~10 วินาที
ไทม์ไลน์

จากการรั่วครั้งแรกถึงเวที I/O 2026

เรียงตามวันที่รายงานสาธารณะ ยังคงเดินหน้าต่อ

  1. 2026 · 05 · 02

    สตริง "Powered by Omni" ตัวแรก

    ผู้ใช้ X @Thomas16937378 พบ "Start with an idea or try a template. Powered by Omni." ในแท็บวิดีโอของ Gemini

  2. 2026 · 05 · 11

    การ์ดพรีวิวฉบับเต็มใน Gemini มือถือ

    TestingCatalog และ Chetaslua เปิดเผยการ์ด "Meet our new video model" พร้อม Model ID เต็มและขีดจำกัดคลิป 10 วินาที

  3. 2026 · 05 · 12 – 18

    เดโมแพร่ในชุมชน

    คลิป "อาจารย์แก้ตรีโกณบนกระดานดำ" โชว์ความเชื่อมโยงของข้อความและความสมจริงเชิงฟิสิกส์ จุดกระแสเทียบกับ Veo 3.1

  4. 2026 · 05 · 19

    เปิดตัวอย่างเป็นทางการที่ Google I/O 2026

    Google เปิดตัว Gemini Omni บนเวทีหลัก I/O 2026 ส่งหน้าผลิตภัณฑ์อย่างเป็นทางการพร้อมวิดีโอเดโม และเริ่มแทนที่ Veo 3.1 ภายในแอป Gemini

  5. 2026 · 05 · 19 เป็นต้นไป

    ทยอยปล่อย AI Avatar, video-to-video และการแก้ไขหลายรอบ

    เวอร์ชันเปิดตัวมาพร้อมอวาตาร์ AI ส่วนตัว การแก้ไข video-to-video และการแก้ไขแบบแชตหลายรอบ — ถูกจำกัดตามภูมิภาคและระดับสมัครสมาชิก

  6. อีกไม่กี่สัปดาห์ · 2026 · 06+

    API สำหรับนักพัฒนาและองค์กรผ่าน Gemini API และ Vertex AI

    Google ยืนยันว่า API สำหรับนักพัฒนาและลูกค้าองค์กรจะ "มาในอีกไม่กี่สัปดาห์" โดยยังไม่กำหนดวันแน่นอน นักวิเคราะห์ประเมินราคาราว 0.10–0.30 ดอลลาร์ต่อวินาทีของวิดีโอที่สร้าง

  7. อยู่ในแผน

    Gemini Omni Pro และเอาต์พุตภาพและเสียง

    ลำดับถัดไปคาดว่า Omni Pro ที่ทรงพลังกว่าจะเปิดตัว พร้อมอินพุตเสียงที่หลากหลายเกินจาก voice reference และช่องทางเอาต์พุตทั้งภาพและเสียง ทำให้คำสัญญา "อินพุตอะไรก็ได้ → เอาต์พุตอะไรก็ได้" สมบูรณ์

คำถามที่พบบ่อย

คำถามที่ถามมากที่สุดเกี่ยวกับ Gemini Omni

Gemini Omni คืออะไรแน่?

เป็นโมเดลมัลติโมดอลรวมของ Google ที่กำลังจะมา สร้างข้อความ ภาพ วิดีโอ และเสียงซิงค์ในตัวภายในสถาปัตยกรรมเดียว — แทบจะรวม Veo, Imagen และ Gemini เข้าด้วยกัน

จะออกเมื่อไหร่?

ออกแล้ว Google ประกาศ Gemini Omni บนเวทีหลัก Google I/O 2026 วันที่ 19 พฤษภาคม 2026 พร้อมเผยแพร่หน้าผลิตภัณฑ์อย่างเป็นทางการและวิดีโอเดโม

เกี่ยวข้องกับ Veo 3.1 อย่างไร?

Gemini Omni คือผู้สืบทอด Veo ในแอป Gemini — Google ระบุชัดว่า Omni "จะแทนที่ Veo ในแอป Gemini" สแต็กวิดีโอตอนนี้ถูกพับเข้ามาในสถาปัตยกรรมเดียวกับข้อความและภาพของ Gemini

สร้างเสียงได้จริงไหม?

ใช่ เสียงบรรยากาศ ดนตรี และบทพูดถูกผลิตในพาสเดียวกับวิดีโอ — เหตุผลทั้งหมดของชื่อ "omni"

ขีดจำกัดความยาวคลิปปัจจุบันคืออะไร?

หน้าผลิตภัณฑ์อย่างเป็นทางการระบุคลิปสูงสุด 10 วินาที พร้อมเสียงในตัว ภาพอ้างอิงสูงสุด 5 รูป และการแก้ไขหลายรอบ

ราคาจะเป็นอย่างไร?

Gemini Omni ต้องใช้แผน Google AI Plus, Pro หรือ Ultra และต้องอายุ 18 ปีขึ้นไป ฟีเจอร์บางอย่าง (อวาตาร์, video-to-video) อาจถูกจำกัดในบางประเทศ

AI avatar ของ Gemini Omni คืออะไร?

เวอร์ชันดิจิทัลของคุณแบบเลือกใช้ ที่ให้ Gemini สร้างวิดีโอที่หน้าตาและเสียงเหมือนคุณ โดยไม่ต้องอัปโหลดรูปใหม่ทุกครั้ง — และมีเพียงคุณเท่านั้นที่ใช้อวาตาร์ของตัวเองได้

แหล่งอ้างอิง

รายงานหลักและลิงก์สาธารณะ

ทุกอย่างในหน้านี้รวบรวมจากแหล่งสาธารณะด้านล่าง แนะนำให้อ่านข้ามแหล่ง

blog.google อ่านแหล่ง

Google Blog · เปิดตัว Gemini Omni

ประกาศทางการที่อธิบายการเปิดตัว Omni Flash ความสามารถ ช่องทาง และแผนการ rollout

blog.google อ่านแหล่ง

Google Blog · 100 สิ่งจาก Google I/O 2026

สรุปฉบับเต็มของ I/O 2026 ครอบคลุม Gemini Omni, แพ็กเกจ AI Ultra ราคา 100 ดอลลาร์ใหม่ และการเปิดตัวที่เกี่ยวข้อง

gemini.google อ่านแหล่ง

Google · หน้าทางการ Gemini Omni

หน้าเปิดตัวอย่างเป็นทางการพร้อมวิดีโอเดโม ทัวร์ความสามารถ แผนที่รองรับ และรายละเอียดการทยอยปล่อย

datacamp.com อ่านแหล่ง

DataCamp · เจาะลึก Google I/O 2026

สรุปจากนักวิเคราะห์อิสระว่า Omni หลอมสแตก Veo + Imagen เข้าเป็นโมเดลเดียวอย่างไร และอะไรพร้อมใช้ตอนนี้กับอะไรจะมาภายหลัง

programminginsider.com อ่านแหล่ง

รายงาน TestingCatalog · Programming Insider

รายละเอียดการรั่ว สตริง UI และการวิเคราะห์เดโมยุคแรก

officechai.com อ่านแหล่ง

OfficeChai · Gemini Omni Spotted

Model ID เต็ม พรอมต์ในแอป และปฏิกิริยาของคอมมูนิตี้

looksyai.in อ่านแหล่ง

Looksy AI · หน้าผลิตภัณฑ์ Gemini Omni

สรุปสเปก กรณีใช้งาน และการเปรียบเทียบอย่างกระชับ

storage.googleapis.com อ่านแหล่ง

รายงานเทคนิค Gemini 2.5

มัลติโมดอลระดับตระกูล บริบทยาว และทิศทางเชิงเอเจนต์