Gemini Omni
กลับไปดูทุกบทความ
9 นาทีอ่าน

วิธีใช้ Gemini Omni ในปี 2026: คู่มือทีละขั้นตอนสำหรับแอป Gemini และ Google Flow

คู่มือการปฏิบัติจริงปี 2026 สำหรับการใช้งาน Gemini Omni — รวมถึงวิธีการเปิดใช้งานโมเดล, การเขียน prompt สำหรับวิดีโอ, การเลเยอร์ข้อมูลอ้างอิง, การแก้ไขในแชท และการส่งออกพร้อมลายน้ำ SynthID

Gemini OmniวิธีการบทเรียนGoogle Flowแอป Gemini2026

สิ่งที่คุณต้องมีก่อนเริ่มใช้งาน

Gemini Omni Flash เปิดใช้งานจริงตั้งแต่งาน Google I/O 2026 (20 พฤษภาคม 2026) ก่อนที่คุณจะสร้างวิดีโอแรกของคุณ ตรวจสอบให้แน่ใจว่าคุณมีสิ่งต่อไปนี้:

  • บัญชี Google ที่มีสถานะปกติ และอายุ 18 ปีขึ้นไป (Omni Flash มีการจำกัดอายุผู้ใช้งาน)
  • แพ็กเกจสมาชิกตัวใดตัวหนึ่งต่อไปนี้ หากคุณต้องการใช้ แอป Gemini หรือ Google Flow:
    • Google AI Plus
    • Google AI Pro
    • Google AI Ultra
  • หากคุณมีเพียงบัญชี Google แบบฟรี คุณยังสามารถใช้งาน Omni Flash ภายในแอป YouTube Shorts หรือแอป YouTube Create ซึ่งเปิดให้ใช้งาน Omni ได้ฟรีในขณะนี้

เว็บเบราว์เซอร์ที่ทันสมัย (Chrome, Edge, Safari, Firefox) และการเชื่อมต่ออินเทอร์เน็ตที่เสถียรนั้นเพียงพอแล้ว — ไม่จำเป็นต้องติดตั้งโปรแกรมอื่นใดเพิ่มเติม Google Flow ทำงานบนเบราว์เซอร์ และแอป Gemini มีให้บริการทั้งบนเว็บ, Android และ iOS

ขั้นตอนที่ 1 · เปิดหน้าต่างการใช้งานที่ถูกต้อง

สถานที่ที่คุณเปิดใช้งาน Omni จะเป็นตัวกำหนดขั้นตอนการทำงานของคุณ โดยมีสามช่องทางการผลิตหลักดังนี้:

  1. แอป Gemini (gemini.google.com หรือแอปบนมือถือ): เหมาะสำหรับการสร้างสรรค์งานที่เน้นการสนทนาอย่างรวดเร็วและการแก้ไขอย่างรวดเร็ว — ถามในแชท รับคลิปกลับมา และปรับปรุงแก้ไขผ่านแชท
  2. Google Flow (labs.google/flow): เหมาะสำหรับผู้สร้างภาพยนตร์, เอเจนซี และใครก็ตามที่วางโครงเรื่อง (storyboard) สำหรับวิดีโอหลายคลิปต่อกัน Flow แสดงผลโมเดลพร้อมบอกค่าใช้จ่ายเครดิตที่ชัดเจน, ตัวเลือกโมเดล และตัวควบคุมในระดับฉาก
  3. แอป YouTube Shorts / YouTube Create: เหมาะสำหรับการสร้างสรรค์ผลงานลงโซเชียลมีเดียทั่วไปแบบฟรี Omni จะแสดงเป็นตัวเลือกการสร้างวิดีโอภายในหน้าต่างเครื่องมือของผู้สร้าง

เลือกใช้งานช่องทางใดช่องทางหนึ่ง โดยโมเดลเดียวกัน — Gemini Omni Flash — จะขับเคลื่อนทั้งสามหน้าต่างการใช้งาน; มีเพียงดีไซน์ของ UI เท่านั้นที่แตกต่างกัน

ขั้นตอนที่ 2 · ตรวจสอบให้แน่ใจว่า Omni เป็นโมเดลที่ใช้งานอยู่

ภายในแอป Gemini ให้ดูที่การตั้งค่าแถบ prompt: ตัวเลือกโมเดลควรให้คุณเลือก Gemini Omni (ซึ่งปัจจุบันเทียบเท่ากับ Omni Flash) หากคุณไม่เห็นตัวเลือกนี้ เป็นไปได้ว่าภูมิภาคของบัญชีหรือระดับการสมัครสมาชิกของคุณยังไม่ได้รับการเปิดใช้งาน — ให้ลองล็อกเอาต์แล้วล็อกอินใหม่อีกครั้ง หรือเปิด Google Flow ซึ่งตัวเลือกโมเดลจะมองเห็นได้ชัดเจนกว่า

ภายใน Google Flow ให้เปิดแผง prompt และตรวจสอบดังนี้:

  • โมเดลที่ใช้งานอยู่: Gemini Omni Flash
  • อัตราส่วนภาพ (Aspect ratio): 16:9, 9:16 หรือ 1:1
  • ระยะเวลา: โดยปกติจะอยู่ที่ 5 / 8 / 10 วินาทีต่อการสร้างหนึ่งครั้ง
  • ค่าใช้จ่ายเครดิตที่แสดง: จะอัปเดตแบบสดเสมอ และอาจมีการเปลี่ยนแปลงระหว่างรอบการอัปเกรดใช้งาน

เอกสารช่วยเหลือของ Flow จาก Google แนะนำอย่างชัดเจนให้คุณตรวจสอบโมเดลที่ใช้งานอยู่และค่าใช้จ่ายเครดิตในการตั้งค่า ก่อนการสร้างแต่ละครั้ง — เนื่องจากข้อจำกัดและราคาอาจมีการเปลี่ยนแปลงได้

ขั้นตอนที่ 3 · เขียนรายละเอียด (Brief) ไม่ใช่แค่ประโยคสั้น ๆ

Omni ทำงานแบบหลายรูปแบบ (multimodal) ทั้งในส่วนของอินพุตและเอาต์พุต ดังนั้น prompt ที่มีประสิทธิภาพสูงสุดจะเขียนเหมือนสรุปรายละเอียดงานสร้างสรรค์ (brief) ความยาวหนึ่งย่อหน้า ไม่ใช่แค่คำโฆษณาสั้น ๆ เทมเพลตที่แนะนำคือ:

You are [PERSONA]. Generate a [DURATION] [ASPECT-RATIO] clip of [SUBJECT] [ACTION] in [SETTING]. Camera: [lens / movement / framing]. Lighting: [direction / colour temperature / contrast]. Audio: [ambient bed], [music style], [key sound cue at timecode], dialogue: [short line]. Reference: [attach image / video / audio].

ตัวอย่างที่เป็นรูปธรรม:

You are a luxury cinematographer in the vein of Wong Kar-wai. Generate a 10-second 16:9 clip of a matte-black wireless headphone resting on a textured concrete plinth. Camera: slow 35mm tracking shot camera-left to camera-right, shallow depth of field. Lighting: soft golden-hour back-light, warm 3200K, low contrast. Audio: low atmospheric drone with a single soft bell strike at 0:07. No dialogue. Reference image: attached product photo for exact colour, stitching and brand mark.

การเขียน prompt ที่ยาวขึ้นไม่ใช่การทำงานเพิ่มขึ้น — แต่มันช่วยลดจำนวนครั้งในการสร้างใหม่ (regeneration) ที่คุณต้องการได้อย่างมีนัยสำคัญ

ขั้นตอนที่ 4 · ใช้เลเยอร์อ้างอิงอย่างเต็มที่

นวัตกรรมที่ใหญ่ที่สุดในปี 2026 คือ Omni ยอมรับ รูปภาพ, คลิปวิดีโอ และแทร็กเสียง ในคำสั่งเดียวกัน จงใช้ประโยชน์จากข้อนี้:

  • ล็อกตัวละคร (Character lock): แนบรูปภาพอ้างอิงเพื่อให้ตัวละครหลักมีความสอดคล้องกันตลอดทุกคลิป
  • ล็อกสไตล์ (Style lock): แนบเฟรมภาพจากงานชิ้นเดิมที่คุณต้องการเลียนแบบ
  • ล็อกการเคลื่อนไหว (Motion lock): แนบวิดีโออ้างอิงสั้น ๆ เพื่อเลียนแบบการเคลื่อนกล้อง
  • ล็อกจังหวะ (Beat lock): แนบแทร็กเพลงและขอให้ Omni ตัดต่อภาพตามจังหวะเพลง

prompt ความยาว 30 คำที่มีการแนบแหล่งอ้างอิงที่ชัดเจนสามแหล่ง เกือบจะทำงานได้ดีกว่า prompt ความยาว 300 คำที่ไม่มีข้อมูลอ้างอิงใด ๆ เลยเสมอ

ขั้นตอนที่ 5 · สร้างวิดีโอ แล้วแก้ไขในแชท (อย่าใช้การ Re-roll ใหม่ทั้งหมด)

เมื่อคุณได้รับคลิปแรกแล้ว อย่าเพิ่งด่วนกดสั่งทำงานใหม่ (re-roll) ทั้งหมดด้วยข้อความที่ปรับแต่งเพิ่มเติม ขั้นตอนการทำงานที่เป็นหัวใจหลักของ Omni คือ การแก้ไขผ่านแชท ตัวอย่างคำสั่งแก้ไขที่ได้ผลดี:

“Swap the watch on the model’s wrist for a brushed-silver chronograph. Keep all other framing, lighting and audio exactly the same.”

“Slow the camera move by 30% and warm the colour temperature by 200 K.”

“Remove the bell strike at 0:07 and add a soft ambient swell from 0:08 to 0:10 instead.”

“Change the background to a futuristic cityscape but keep the subject identical.”

การแก้ไขตามหลักการสนทนาในแชทนั้น มีค่าใช้จ่ายถูกกว่าการสั่งสร้างใหม่ทั้งหมด ทั้งยังช่วยรักษารูปแบบแทร็กเสียงที่คุณชอบอยู่แล้วเอาไว้ และรักษาอัตลักษณ์ความต่อเนื่องของตัวละครเอาไว้ด้วย จงถือว่าคลิปสร้างสรรค์ครั้งแรกเป็นฐานเริ่มต้น แล้วค่อยทำการสั่งปรับแต่งแก้ไขทีละขั้นจากจุดนั้น

ขั้นตอนที่ 6 · เชื่อมโยงคลิปเพื่อสร้างฉากที่ยาวขึ้น

Omni Flash จำกัดความยาววิดีโอต่อหนึ่งคลิปไว้ที่ 10 วินาที หากต้องการสร้างผลงานที่ยาวขึ้น ให้สร้างคลิป Omni หลาย ๆ ตัว แนบคลิปก่อนหน้าไว้เป็นข้อมูลอ้างอิง และสั่งให้ Omni รักษาความต่อเนื่องของภาพ:

“Generate a 10-second clip that continues from the attached clip. Keep the subject, wardrobe and lighting identical. Hold the audio bed. Begin the camera move where the previous clip ended.”

Google Flow ช่วยให้ขั้นตอนนี้ง่ายขึ้นโดยมีฟังก์ชันเชื่อมต่อคลิปในระดับฉาก ส่วนในแอป Gemini คุณสามารถทำแบบเดียวกันได้เองโดยใช้รูปแบบการส่งโมเดลอ้างอิงแนบไปด้วย

ขั้นตอนที่ 7 · การส่งออก, ลายน้ำ และแหล่งที่มา

การส่งออกผลงานจาก Omni ทุกครั้งจะมีการติดสิ่งเหล่านี้ไปด้วย:

  • SynthID: ลายน้ำที่มองไม่เห็นด้วยตาเปล่าของ Google ซึ่งถูกฝังไว้ในพิกเซลภาพและคลื่นเสียง
  • C2PA Content Credentials: ข้อมูลเมตาดาต้ามาตรฐานเปิดที่ระบุว่าคลิปนี้ถูกสร้างขึ้นโดย Gemini

คุณสามารถตรวจสอบความถูกต้องของผลงานจาก Omni ผ่านทางแอป Gemini ได้ และระบบตรวจสอบกำลังจะเริ่มเปิดใช้งานบนเบราว์เซอร์ Chrome และระบบค้นหา Google เร็ว ๆ นี้ จากมุมมองของผู้สร้าง ไม่มีงานส่วนเสริมอื่นใดที่ต้องทำ — เครื่องหมายจะถูกเพิ่มเข้าไปเองโดยอัตโนมัติ — แต่ก็คุ้มค่าที่จะเรียนรู้ว่ามันถูกติดตั้งไว้ โดยเฉพาะเมื่อคุณขายสิทธิ์การใช้งานคลิปให้แก่ลูกค้าที่ให้ความสำคัญกับการเปิดเผยเนื้อหาที่สร้างสรรค์โดย AI

ขั้นตอนที่ 8 · ตั้งค่า AI Avatar ของคุณ (ไม่บังคับ)

หากคุณต้องการให้ Gemini Omni สร้างภาพของคุณได้อย่างสอดคล้องกันตลอดในวิดีโอหลายตัว ให้ตั้งค่า AI Avatar เพียงครั้งเดียว:

  1. เปิดส่วน Avatar ในแอป Gemini หรือ Google Flow
  2. ทำตามขั้นตอนบนหน้าจอเพื่อบันทึกภาพใบหน้าและบันทึกเสียงของคุณ
  3. ยืนยันกระบวนการให้สิทธิ์ยินยอม — มีเพียงคุณคนเดียวเท่านั้นที่สามารถใช้งานอวาตาร์ของคุณได้
  4. จากนั้นเป็นต้นไป คำสั่ง prompt จะสามารถพิมพ์อ้างถึง “me” (ฉัน) หรือ “the avatar” (อวาตาร์) ได้ทันทีโดยไม่จำเป็นต้องอัปโหลดรูปภาพใหม่อีกครั้ง

Google ได้ชี้แจงอย่างชัดเจนว่ากำลังปรับปรุงมาตรการความปลอดภัยและความเป็นส่วนตัวของระบบอวาตาร์อยู่ ดังนั้นให้เตรียมพร้อมรับมือกับข้อจำกัดเรื่องประเทศใช้งานและฟีเจอร์บางอย่างในช่วงแรกของการเปิดตัว

ข้อผิดพลาดทั่วไปที่ควรหลีกเลี่ยง

  • การละเลยการใช้แหล่งอ้างอิง: prompt ที่มีเพียงตัวอักษรเป็นวิธีที่รวดเร็วที่สุดที่จะละลายเครดิตบัญชีของคุณเล่นโดยไม่ได้ผลลัพธ์ที่ดี
  • การใช้ re-roll แทนการพิมพ์แก้ไขผ่านแชท: การสร้างใหม่ทั้งหมดทุกรอบมีราคาสูงกว่า และมันจะลบส่วนผสมแทร็กเสียงเดิมที่เคยดีออกไป
  • การละเลยระยะเวลา: คลิป 10 วินาทีอาจไม่ใช่ตัวเลือกที่ตอบโจทย์เสมอไป — ช็อตนำเสนอสินค้าความยาว 5 วินาทีแบบกระชับ มีราคาถูกกว่า ทำงานได้เร็วกว่า และสร้างแรงกระตุ้นได้ดีกว่าเสมอ
  • การลืมตั้งค่าโมเดลที่ใช้งานอยู่: หากคุณสลับไปใช้ Veo สำหรับหนึ่งฉากแล้วสลับกลับมาใช้ Omni สำหรับฉากถัดไป สไตล์ความต่อเนื่องของผลงานคุณอาจจะสะดุดลงได้

บทสรุป

การใช้ประโยชน์จาก Gemini Omni ให้ได้ผลสูงสุดในปี 2026 ไม่ใช่เรื่องของการค้นหาเมนูลับที่ซ่อนอยู่ แต่เป็นเรื่องของการมีปฏิสัมพันธ์กับโมเดลเสมือนว่าผู้กำกับกำลังสื่อสารสั่งงานทีมงาน: เขียนสรุปบรีฟงานให้ชัดเจน, แนบแหล่งอ้างอิงให้แน่นหนา, สั่งทำงานปรับปรุงทีละขั้นตอนแทนการสั่งจัดฉากใหม่ทั้งหมด และเชื่อมโยงคลิปต่าง ๆ เพื่อเพิ่มความยาว ทำสี่ข้อนี้เป็นประจำ แล้วคุณจะพบว่า Omni Flash เป็นช่องทางที่รวดเร็วที่สุดในการเผยแพร่วิดีโอสำเร็จรูปบนเว็บได้อย่างมีคุณภาพยอดเยี่ยม