راهنمای گامبهگام نحوه استفاده از Gemini Omni در سال ۲۰۲۶: برای اپلیکیشن Gemini و Google Flow
راهنمای عملی سال ۲۰۲۶ برای استفاده از Gemini Omni — شامل نحوه فعالسازی مدل، نوشتن پرامپت برای ویدیو، لایهبندی مراجع، ویرایش در چت، و خروجی گرفتن با واترمارک SynthID.
آنچه قبل از شروع نیاز دارید
مدل Gemini Omni Flash از زمان کنفرانس Google I/O 2026 (۲۰ مه ۲۰۲۶) فعال و در دسترس است. قبل از اینکه اولین ویدیوی خود را تولید کنید، مطمئن شوید که موارد زیر را دارید:
- یک حساب کاربری Google فعال و با وضعیت مناسب، و سن شما ۱۸ سال یا بیشتر باشد (مدل Omni Flash دارای محدودیت سنی است).
- یکی از اشتراکهای زیر در صورتی که میخواهید از اپلیکیشن Gemini یا Google Flow استفاده کنید:
- Google AI Plus
- Google AI Pro
- Google AI Ultra
- اگر فقط حساب کاربری رایگان Google دارید، همچنان میتوانید از Omni Flash در داخل اپلیکیشن YouTube Shorts یا اپلیکیشن YouTube Create استفاده کنید، که اکنون مدل Omni را به صورت رایگان ارائه میدهند.
یک مرورگر مدرن (Chrome، Edge، Safari، Firefox) و یک اتصال اینترنتی پایدار کافی است — نیازی به نصب چیز دیگری نیست. Google Flow در مرورگر اجرا میشود، و اپلیکیشن Gemini روی وب و سیستمهای Android و iOS در دسترس است.
مرحله ۱ · رابط کاربری مناسب را باز کنید
محیطی که در آن Omni را باز میکنید، جریان کاری شما را تعیین میکند. سه مسیر اصلی برای تولید وجود دارد:
- اپلیکیشن Gemini (وبسایت gemini.google.com یا اپلیکیشن موبایل). بهترین گزینه برای تولید سریع و تعاملی بر پایه چت و ویرایشهای سریع — در چت بنویسید، یک کلیپ دریافت کنید، و سپس از طریق چت آن را اصلاح و تکرار کنید.
- برنامه Google Flow (آدرس labs.google/flow). بهترین گزینه برای فیلمسازان، آژانسها، و هر کسی که سناریوهای تصویری متوالی برای چندین کلیپ طراحی میکند. Flow مدل را با هزینههای اعتبار واضح، ابزار انتخاب مدل، و کنترلهای سطح صحنه نشان میدهد.
- اپلیکیشن YouTube Shorts / YouTube Create. بهترین گزینه برای تولید رایگان و روزمره برای شبکههای اجتماعی. مدل Omni به عنوان یک گزینه تولید در داخل رابط کاربری سازندگان ظاهر میشود.
یک محیط کاربری را انتخاب کنید. دقیقاً همان مدل — Gemini Omni Flash — نیروبخش هر سه رابط کاربری است؛ تنها طراحی ظاهر کاربری تفاوت دارد.
مرحله ۲ · مطمئن شوید Omni مدل فعال است
در داخل اپلیکیشن Gemini، به تنظیمات نوار پرامپت (prompt-bar) نگاه کنید: یک ابزار انتخاب مدل باید به شما امکان انتخاب Gemini Omni (معادل فعلی Omni Flash) را بدهد. اگر آن را پیدا نکردید، ممکن است هنوز در منطقه جغرافیایی یا سطح اشتراک شما فعال نشده باشد — خارج شدن و ورود مجدد را امتحان کنید، یا Google Flow را باز کنید که در آن ابزار انتخاب مدل واضحتر است.
در داخل Google Flow، پنل پرامپت را باز کنید و از موارد زیر مطمئن شوید:
- مدل فعال: Gemini Omni Flash
- نسبت تصویر (Aspect ratio): ۱۶:۹، ۹:۱۶ یا ۱:۱
- مدت زمان: معمولاً ۵ / ۸ / ۱۰ ثانیه برای هر بار تولید
- هزینه اعتبار نشان داده شده: همیشه به روز و زنده است، و ممکن است بین دورههای انتشار تغییر کند
مستندات راهنمای Flow خود گوگل به وضوح توصیه میکنند که مدل فعال و هزینه اعتبار را در تنظیمات قبل از هر بار تولید بررسی کنید — چرا که محدودیتها و قیمتها میتوانند تغییر کنند.
مرحله ۳ · یک خلاصه خلاقانه (Brief) بنویسید، نه فقط یک جمله کوتاه
مدل Omni در هر دو بخش ورودی و خروجی چندرسانهای (multimodal) است، بنابراین قویترین پرامپتها مانند یک خلاصه خلاقانه (brief) در قالب یک پاراگراف نوشته میشوند، نه فقط یک شعار ساده. یک قالب قابل اعتماد برای کار:
You are [PERSONA]. Generate a [DURATION] [ASPECT-RATIO] clip of [SUBJECT] [ACTION] in [SETTING]. Camera: [lens / movement / framing]. Lighting: [direction / colour temperature / contrast]. Audio: [ambient bed], [music style], [key sound cue at timecode], dialogue: [short line]. Reference: [attach image / video / audio].
یک مثال ملموس:
You are a luxury cinematographer in the vein of Wong Kar-wai. Generate a 10-second 16:9 clip of a matte-black wireless headphone resting on a textured concrete plinth. Camera: slow 35mm tracking shot camera-left to camera-right, shallow depth of field. Lighting: soft golden-hour back-light, warm 3200K, low contrast. Audio: low atmospheric drone with a single soft bell strike at 0:07. No dialogue. Reference image: attached product photo for exact colour, stitching and brand mark.
نوشتن پرامپت طولانیتر به معنای کار اضافی نیست — بلکه به طور موثری تعداد دفعات تولید مجدد (regeneration) را که نیاز دارید کاهش میدهد.
مرحله ۴ · مراجع خود را به شدت لایهبندی کنید
بزرگترین پیشرفت در سال ۲۰۲۶ این است که Omni تصاویر، کلیپهای ویدئویی، و لاینهای صوتی را در همان دستورالعمل پرامپت میپذیرد. از این قابلیت استفاده کنید:
- قفل کاراکتر (Character lock): یک عکس مرجع اضافه کنید تا شخصیت اصلی در کلیپهای مختلف سازگار بماند.
- قفل سبک (Style lock): فریم یا عکسی از یک اثر موجود که میخواهید از آن تقلید کنید، قرار دهید.
- قفل حرکت (Motion lock): یک ویدیوی مرجع کوتاه برای تقلید از یک حرکت دوربین خاص اضافه کنید.
- قفل ضربآهنگ (Beat lock): یک قطعه موسیقی اضافه کنید و از Omni بخواهید صحنههای بصری را هماهنگ با ریتم برش دهد.
یک پرامپت ۳۰ کلمهای با سه مرجع قوی تقریباً همیشه عملکرد بهتری نسبت به یک پرامپت ۳۰۰ کلمهای بدون مراجع صوتی و تصویری دارد.
مرحله ۵ · ویدیو را تولید کنید، سپس در چت ویرایش کنید (دوباره تولید نکنید)
به محض اینکه اولین کلیپ خود را دریافت کردید، در برابر تمایل به اجرای مجدد فوری پرامپت با یک متن اصلاحشده مقاومت کنید. جریان کاری اصلی Omni ویرایش تعاملی در چت است. نمونههایی که به خوبی کار میکنند:
“Swap the watch on the model’s wrist for a brushed-silver chronograph. Keep all other framing, lighting and audio exactly the same.”
“Slow the camera move by 30% and warm the colour temperature by 200 K.”
“Remove the bell strike at 0:07 and add a soft ambient swell from 0:08 to 0:10 instead.”
“Change the background to a futuristic cityscape but keep the subject identical.”
ویرایشهای مبتنی بر چت بسیار ارزانتر از فرآیندهای تولید جدید هستند، لاین صوتی را که از قبل دوست داشتید حفظ میکنند، و هویت شخصیت را حفظ میکنند. با اولین تولید خود به عنوان یک پایه برخورد کنید و سپس آن را اصلاح کنید.
مرحله ۶ · کلیپها را برای ایجاد صحنههای طولانیتر زنجیره کنید
مدل Omni Flash کلیپهای فردی را حداکثر به ۱۰ ثانیه محدود میکند. برای تولید یک اثر طولانیتر، چندین کلیپ تولید کنید، کلیپ قبلی را به عنوان مرجع ضمیمه کنید و از Omni بخواهید تداوم را حفظ کند:
“Generate a 10-second clip that continues from the attached clip. Keep the subject, wardrobe and lighting identical. Hold the audio bed. Begin the camera move where the previous clip ended.”
برنامه Google Flow این فرآیند را با ارائه قابلیت زنجیرهسازی کلیپها در سطح صحنه آسان میکند؛ در اپلیکیشن Gemini میتوانید همین کار را به صورت دستی با استفاده از الگوی مرجع ضمیمهشده انجام دهید.
مرحله ۷ · خروجی، واترمارک و اثبات اصالت منبع
هر خروجی از Omni شامل موارد زیر است:
- SynthID: یک واترمارک غیرقابل تشخیص از Google که در پیکسلها و صدا ادغام شده است.
- C2PA Content Credentials: متادیتا با استانداردهای باز که ویدیو را به عنوان تولید شده توسط Gemini شناسایی میکند.
شما میتوانید هر خروجی از Omni را از طریق اپلیکیشن Gemini تأیید کنید، و قابلیت تأیید به زودی روی مرورگر Chrome و موتور جستجوی Google نیز ارائه خواهد شد. از دیدگاه یک سازنده محتوا کار اضافی برای انجام دادن وجود ندارد — نشانها به صورت خودکار اضافه میشوند — اما دانستن وجود آنها مفید است، به خصوص اگر در حال ارائه مجوز استفاده از ویدیوها به مشتریانی هستید که به افشای محتوای تولید شده توسط هوش مصنوعی اهمیت میدهند.
مرحله ۸ · آواتار هوش مصنوعی خود را تنظیم کنید (اختیاری)
اگر میخواهید Gemini Omni تصویر شما را به طور سازگار در چندین ویدیو نمایش دهد، یک بار AI Avatar را تنظیم کنید:
- بخش Avatar را در اپلیکیشن Gemini یا Google Flow باز کنید.
- دستورالعملهای روی صفحه را برای ثبت چهره و صدا دنبال کنید.
- شرایط استفاده را تأیید کنید — فقط شما میتوانید از آواتار خود استفاده کنید.
- از آن به بعد، پرامپتها میتوانند بدون بارگذاری مجدد عکسها، مستقیماً به “me” (من) یا “the avatar” (آواتار) اشاره کنند.
گوگل به وضوح اعلام کرده است که همچنان در حال تقویت اقدامات حفاظتی برای آواتار است، بنابراین در طول دورههای عرضه اولیه، انتظار برخی محدودیتهای کشوری و ویژگی را داشته باشید.
اشتباهات رایج که باید از آنها دوری کنید
- نادیده گرفتن مراجع تصویری و عکس محصولات. پرامپتهای متنی ساده سریعترین راه برای هدر دادن اعتبار شما هستند.
- تولید مجدد کامل (re-roll) به جای ویرایش. هر فرآیند تولید جدید هزینه بیشتری دارد و لاین صوتی خوبی را که از قبل کار میکرد، از بین میبرد.
- نادیده گرفتن مدت زمان. یک ویدیوی ۱۰ ثانیهای همیشه پاسخ مناسبی نیست — یک لایو از محصول متمرکز و فشرده ۵ ثانیهای ارزانتر، سریعتر و اغلب تأثیرگذارتر است.
- فراموش کردن مدل فعال. اگر برای یک شات به Veo بروید و برای شات بعدی به Omni بازگردید، ممکن است تداوم سبک شما آسیب ببیند.