Cách Viết Prompt Cho Gemini Omni Năm 2026: Hướng Dẫn Thực Hành Prompt AI Video Đa Phương Thức
Một khung prompt 2026 cho mô hình Gemini Omni rò rỉ của Google. Persona, task, format, context — cộng với máy quay, âm thanh và tài nguyên tham chiếu — tất cả trong một brief.
Vì sao viết prompt cho Omni khác biệt
Phần lớn prompt AI video viết trong 2024–2025 được thiết kế cho mô hình video chuyên dụng, ngữ cảnh ngắn. Bạn viết một câu, chọn preset phong cách, nhấn generate. Với Gemini Omni — mô hình đa phương thức hợp nhất rò rỉ của Google — prompt làm việc nhiều hơn rất nhiều. Cùng một prompt duy nhất đang điều hướng văn bản, ảnh, video và âm thanh đồng bộ trong một cửa sổ ngữ cảnh dài.
Điều đó dời prompt từ “mô tả cảnh” sang “mô tả toàn bộ deliverable.” Hướng dẫn này là khung làm việc để khai thác Omni tối đa khi nó hạ cánh, với kỹ thuật mượn từ hướng dẫn prompt chính thức của Google và các thẻ preview Omni rò rỉ.
Khung bốn phần: Persona · Task · Format · Context
Playbook prompt rộng hơn của Google cho họ Gemini đề xuất bốn khối xây dựng:
- Persona — chuyên môn bạn muốn mô hình rút từ (“đóng vai nhà quay phim”, “với tư cách designer thương hiệu”, “với tư cách biên tập tài liệu”).
- Task — thứ bạn muốn sản xuất (“hero shot 10 giây của tai nghe mới”, “product reveal 9:16”).
- Format — ràng buộc cấu trúc (“16:9, 1080p, tracking shot chậm, ánh sáng golden-hour”).
- Context — thương hiệu, đối tượng và tài liệu tham chiếu mô hình nên rút từ.
Với Omni, điều này ánh xạ trực tiếp vào một cấu trúc brief sạch:
Bạn là [PERSONA].
Hãy tạo [TASK].
Format: [tỉ lệ khung, thời lượng, độ phân giải, ngôn ngữ máy quay, ánh sáng].
Context: [giọng thương hiệu, đối tượng, tham chiếu, gợi ý âm thanh].
Một ví dụ thực:
Bạn là nhà quay phim sang trọng theo phong cách Vương Gia Vệ. Hãy tạo một hero shot 10 giây của chiếc tai nghe wireless đen lì đặt trên bệ bê tông có vân. Format: 16:9, 1080p, tracking shot 35mm chậm từ trái-máy quay sang phải-máy quay, back-light golden-hour mềm, depth of field nông. Context: thương hiệu là âm thanh cao cấp Bắc Âu tối giản. Âm thanh: drone bầu không khí trầm với một tiếng chuông nhẹ tại 0:07 khi máy quay đi qua dấu thương hiệu. Ảnh tham chiếu: xem ảnh sản phẩm đính kèm để màu và đường may chính xác.
Ba C: Concise, Clear, Consistent
Hướng dẫn tham chiếu prompt của chính Google nhấn mạnh ba nguyên tắc dịch sạch sang Omni:
- Concise. Dài không bằng tốt. Cắt từ thừa. Giữ một chủ thể chính và một hành động chính mỗi prompt.
- Clear. Tránh mô tả mơ hồ như “làm tốt hơn” hay “điện ảnh hơn.” Thay bằng chỉ dẫn cụ thể: “tăng depth of field”, “nhiệt độ màu ấm hơn”, “chuyển động máy quay chậm hơn ở tốc độ 0.5x.”
- Consistent. Dùng cùng từ vựng cho cùng khái niệm xuyên các lần lặp. Nếu bạn gọi “tracking shot” một lần, đừng đổi sang “dolly move” sau — mô hình coi chúng là tín hiệu khác.
Tận dụng prompt phân tầng, ngữ cảnh dài
Khác với mô hình video ngữ cảnh ngắn, Omni kế thừa cửa sổ ngữ cảnh dài của Gemini. Điều đó có nghĩa bạn có thể — và nên — viết prompt phân tầng, mô tả. Một brief năng suất bao gồm:
- Chủ thể: ai hoặc cái gì trong khung, gồm tham chiếu khóa nhân dạng.
- Mood: phổ cảm xúc và nhịp.
- Máy quay: ống kính, chuyển động, thay đổi khung hình trong clip.
- Ánh sáng: nguồn, hướng, nhiệt độ màu, độ tương phản.
- Lời thoại: mọi câu nói, kèm thời gian lip-sync nếu liên quan.
- Thiết kế âm thanh: bed nền, thể loại nhạc, gợi ý âm thanh chính kèm timecode.
- Bối cảnh thương hiệu hoặc phong cách: tham chiếu tới tác phẩm hiện có hoặc ngôn ngữ thị giác.
Bạn về cơ bản đang viết một treatment một trang, không phải một câu. Ngữ cảnh dài của Omni được xây cho điều này.
Dùng tài nguyên tham chiếu mạnh tay
Danh sách tính năng Omni rò rỉ nhấn rõ đầu vào tham chiếu: ảnh, clip video và bản nhạc đều có thể kết hợp trong một chỉ dẫn duy nhất. Cách dùng cụ thể:
- Character lock: đính kèm ảnh tham chiếu của nhân vật chính để giữ họ nhất quán xuyên nhiều omni-clip.
- Style lock: đính kèm một khung từ tác phẩm hiện có để neo color grade và bố cục.
- Motion lock: đính kèm video tham chiếu ngắn để bắt chước chuyển động máy quay hoặc hành động nhân vật.
- Beat lock: đính kèm bản nhạc và yêu cầu Omni cắt hình theo beat (đặc biệt hữu ích cho Reels và music video).
Tài nguyên tham chiếu mang nhiều tín hiệu mỗi byte hơn hẳn so với văn bản. Một prompt 30 từ với ba ảnh tham chiếu hầu như luôn vượt một prompt 300 từ không tham chiếu.
Chỉnh sửa trong chat thay vì sinh lại
Sự dịch chuyển workflow lớn nhất Omni được đồn đại đưa vào là chỉnh sửa trực tiếp trong chat. Thay vì sinh lại toàn bộ clip khi một yếu tố sai, bạn có thể yêu cầu:
“Đổi đồng hồ trên cổ tay người mẫu sang chronograph bạc chải. Giữ mọi khung hình, ánh sáng và âm thanh khác y nguyên.”
“Chậm chuyển động máy quay 30% và ấm nhiệt độ màu thêm 200 K.”
“Bỏ tiếng chuông tại 0:07 và thêm một dải ambient mềm từ 0:08 đến 0:10.”
Điều này phản chiếu cách Nano Banana định nghĩa lại trải nghiệm chỉnh sửa ảnh năm 2025. Ngụ ý cho nghệ thuật prompt rất lớn: prompt đầu tiên không cần hoàn hảo nữa. Sinh một nền mạnh, rồi điều hướng. Mẫu đó cũng rẻ hơn về mặt tính toán so với sinh lại liên tục.
Năm mẫu prompt riêng cho Omni đáng sao chép
Bộ khởi đầu các mẫu ánh xạ tốt vào điểm mạnh mô hình:
1. Hero sản phẩm
Hãy tạo hero shot [thời lượng] [tỉ lệ khung] của [sản phẩm], [ánh sáng], [chuyển động máy quay]. Audio: [bed ambient] với [âm thanh đặc trưng] tại [timecode]. Tham chiếu: [đính kèm ảnh sản phẩm].
2. Reel / Short có lời thoại on-mic
9:16, [thời lượng]. Chủ thể đọc câu “[copy ngắn]” trực tiếp vào máy quay trong [bối cảnh]. Lip-sync chính xác. Ambient nền: [âm thanh môi trường]. Khớp nhịp với [audio tham chiếu].
3. Cut music video
Hãy tạo [thời lượng] [chủ thể] thực hiện [hành động] theo bản nhạc đính kèm. Cắt hình trên beat. Duy trì tính nhất quán nhân vật xuyên clip. Ánh sáng theo đường cong năng lượng của track.
4. Khối xây dựng phim ngắn sinematic
Omni-clip 10 giây: [chủ thể] [hành động] trong [môi trường]. [Setup ánh sáng] liên tục. Giữ bed audio xuyên cut để clip này có thể được nối với clip trước (đính kèm).
5. Chỉnh sửa hội thoại
Lấy thế hệ trước và [thay đổi cụ thể]. Giữ [danh sách yếu tố cần bảo toàn] không đổi. Xác nhận thay đổi có hiệu lực trên [khung hoặc timecode cụ thể].
Những gì cần thử ngày đầu
Khi cuối cùng có tay vào Omni, bốn bài kiểm tra sẽ cho bạn biết phần lớn cần biết:
- Kết xuất chữ trên màn hình — chữ trên bảng đen hay biển báo có giữ rõ ràng xuyên cả clip không?
- Lip sync trên lời thoại — mô hình có cho hình miệng đúng trong một lần sinh không?
- Liên tục đa-clip — nối hai omni-clip 10 giây và kiểm tra rằng nhân vật, ánh sáng và bed audio thực sự được giữ.
- Trung thực với tham chiếu — một ảnh tham chiếu khóa danh tính nhân vật, hay chỉ gợi ý?
Nếu Omni làm tốt ba trong bốn, thư viện prompt của bạn đột nhiên giá trị hơn tool stack. Lên kế hoạch tương ứng.