Gemini Omni
بازگشت به همه مقالات
9 دقیقه مطالعه

راهنمای گام‌به‌گام نحوه استفاده از Gemini Omni در سال ۲۰۲۶: برای اپلیکیشن Gemini و Google Flow

راهنمای عملی سال ۲۰۲۶ برای استفاده از Gemini Omni — شامل نحوه فعال‌سازی مدل، نوشتن پرامپت برای ویدیو، لایه‌بندی مراجع، ویرایش در چت، و خروجی گرفتن با واترمارک SynthID.

Gemini Omniنحوه استفادهآموزشGoogle Flowاپلیکیشن Gemini2026

آنچه قبل از شروع نیاز دارید

مدل Gemini Omni Flash از زمان کنفرانس Google I/O 2026 (۲۰ مه ۲۰۲۶) فعال و در دسترس است. قبل از اینکه اولین ویدیوی خود را تولید کنید، مطمئن شوید که موارد زیر را دارید:

  • یک حساب کاربری Google فعال و با وضعیت مناسب، و سن شما ۱۸ سال یا بیشتر باشد (مدل Omni Flash دارای محدودیت سنی است).
  • یکی از اشتراک‌های زیر در صورتی که می‌خواهید از اپلیکیشن Gemini یا Google Flow استفاده کنید:
    • Google AI Plus
    • Google AI Pro
    • Google AI Ultra
  • اگر فقط حساب کاربری رایگان Google دارید، همچنان می‌توانید از Omni Flash در داخل اپلیکیشن YouTube Shorts یا اپلیکیشن YouTube Create استفاده کنید، که اکنون مدل Omni را به صورت رایگان ارائه می‌دهند.

یک مرورگر مدرن (Chrome، Edge، Safari، Firefox) و یک اتصال اینترنتی پایدار کافی است — نیازی به نصب چیز دیگری نیست. Google Flow در مرورگر اجرا می‌شود، و اپلیکیشن Gemini روی وب و سیستم‌های Android و iOS در دسترس است.

مرحله ۱ · رابط کاربری مناسب را باز کنید

محیطی که در آن Omni را باز می‌کنید، جریان کاری شما را تعیین می‌کند. سه مسیر اصلی برای تولید وجود دارد:

  1. اپلیکیشن Gemini (وب‌سایت gemini.google.com یا اپلیکیشن موبایل). بهترین گزینه برای تولید سریع و تعاملی بر پایه چت و ویرایش‌های سریع — در چت بنویسید، یک کلیپ دریافت کنید، و سپس از طریق چت آن را اصلاح و تکرار کنید.
  2. برنامه Google Flow (آدرس labs.google/flow). بهترین گزینه برای فیلم‌سازان، آژانس‌ها، و هر کسی که سناریوهای تصویری متوالی برای چندین کلیپ طراحی می‌کند. Flow مدل را با هزینه‌های اعتبار واضح، ابزار انتخاب مدل، و کنترل‌های سطح صحنه نشان می‌دهد.
  3. اپلیکیشن YouTube Shorts / YouTube Create. بهترین گزینه برای تولید رایگان و روزمره برای شبکه‌های اجتماعی. مدل Omni به عنوان یک گزینه تولید در داخل رابط کاربری سازندگان ظاهر می‌شود.

یک محیط کاربری را انتخاب کنید. دقیقاً همان مدل — Gemini Omni Flash — نیروبخش هر سه رابط کاربری است؛ تنها طراحی ظاهر کاربری تفاوت دارد.

مرحله ۲ · مطمئن شوید Omni مدل فعال است

در داخل اپلیکیشن Gemini، به تنظیمات نوار پرامپت (prompt-bar) نگاه کنید: یک ابزار انتخاب مدل باید به شما امکان انتخاب Gemini Omni (معادل فعلی Omni Flash) را بدهد. اگر آن را پیدا نکردید، ممکن است هنوز در منطقه جغرافیایی یا سطح اشتراک شما فعال نشده باشد — خارج شدن و ورود مجدد را امتحان کنید، یا Google Flow را باز کنید که در آن ابزار انتخاب مدل واضح‌تر است.

در داخل Google Flow، پنل پرامپت را باز کنید و از موارد زیر مطمئن شوید:

  • مدل فعال: Gemini Omni Flash
  • نسبت تصویر (Aspect ratio): ۱۶:۹، ۹:۱۶ یا ۱:۱
  • مدت زمان: معمولاً ۵ / ۸ / ۱۰ ثانیه برای هر بار تولید
  • هزینه اعتبار نشان داده شده: همیشه به روز و زنده است، و ممکن است بین دوره‌های انتشار تغییر کند

مستندات راهنمای Flow خود گوگل به وضوح توصیه می‌کنند که مدل فعال و هزینه اعتبار را در تنظیمات قبل از هر بار تولید بررسی کنید — چرا که محدودیت‌ها و قیمت‌ها می‌توانند تغییر کنند.

مرحله ۳ · یک خلاصه خلاقانه (Brief) بنویسید، نه فقط یک جمله کوتاه

مدل Omni در هر دو بخش ورودی و خروجی چندرسانه‌ای (multimodal) است، بنابراین قوی‌ترین پرامپت‌ها مانند یک خلاصه خلاقانه (brief) در قالب یک پاراگراف نوشته می‌شوند، نه فقط یک شعار ساده. یک قالب قابل اعتماد برای کار:

You are [PERSONA]. Generate a [DURATION] [ASPECT-RATIO] clip of [SUBJECT] [ACTION] in [SETTING]. Camera: [lens / movement / framing]. Lighting: [direction / colour temperature / contrast]. Audio: [ambient bed], [music style], [key sound cue at timecode], dialogue: [short line]. Reference: [attach image / video / audio].

یک مثال ملموس:

You are a luxury cinematographer in the vein of Wong Kar-wai. Generate a 10-second 16:9 clip of a matte-black wireless headphone resting on a textured concrete plinth. Camera: slow 35mm tracking shot camera-left to camera-right, shallow depth of field. Lighting: soft golden-hour back-light, warm 3200K, low contrast. Audio: low atmospheric drone with a single soft bell strike at 0:07. No dialogue. Reference image: attached product photo for exact colour, stitching and brand mark.

نوشتن پرامپت طولانی‌تر به معنای کار اضافی نیست — بلکه به طور موثری تعداد دفعات تولید مجدد (regeneration) را که نیاز دارید کاهش می‌دهد.

مرحله ۴ · مراجع خود را به شدت لایه‌بندی کنید

بزرگ‌ترین پیشرفت در سال ۲۰۲۶ این است که Omni تصاویر، کلیپ‌های ویدئویی، و لاین‌های صوتی را در همان دستورالعمل پرامپت می‌پذیرد. از این قابلیت استفاده کنید:

  • قفل کاراکتر (Character lock): یک عکس مرجع اضافه کنید تا شخصیت اصلی در کلیپ‌های مختلف سازگار بماند.
  • قفل سبک (Style lock): فریم یا عکسی از یک اثر موجود که می‌خواهید از آن تقلید کنید، قرار دهید.
  • قفل حرکت (Motion lock): یک ویدیوی مرجع کوتاه برای تقلید از یک حرکت دوربین خاص اضافه کنید.
  • قفل ضرب‌آهنگ (Beat lock): یک قطعه موسیقی اضافه کنید و از Omni بخواهید صحنه‌های بصری را هماهنگ با ریتم برش دهد.

یک پرامپت ۳۰ کلمه‌ای با سه مرجع قوی تقریباً همیشه عملکرد بهتری نسبت به یک پرامپت ۳۰۰ کلمه‌ای بدون مراجع صوتی و تصویری دارد.

مرحله ۵ · ویدیو را تولید کنید، سپس در چت ویرایش کنید (دوباره تولید نکنید)

به محض اینکه اولین کلیپ خود را دریافت کردید، در برابر تمایل به اجرای مجدد فوری پرامپت با یک متن اصلاح‌شده مقاومت کنید. جریان کاری اصلی Omni ویرایش تعاملی در چت است. نمونه‌هایی که به خوبی کار می‌کنند:

“Swap the watch on the model’s wrist for a brushed-silver chronograph. Keep all other framing, lighting and audio exactly the same.”

“Slow the camera move by 30% and warm the colour temperature by 200 K.”

“Remove the bell strike at 0:07 and add a soft ambient swell from 0:08 to 0:10 instead.”

“Change the background to a futuristic cityscape but keep the subject identical.”

ویرایش‌های مبتنی بر چت بسیار ارزان‌تر از فرآیندهای تولید جدید هستند، لاین صوتی را که از قبل دوست داشتید حفظ می‌کنند، و هویت شخصیت را حفظ می‌کنند. با اولین تولید خود به عنوان یک پایه برخورد کنید و سپس آن را اصلاح کنید.

مرحله ۶ · کلیپ‌ها را برای ایجاد صحنه‌های طولانی‌تر زنجیره کنید

مدل Omni Flash کلیپ‌های فردی را حداکثر به ۱۰ ثانیه محدود می‌کند. برای تولید یک اثر طولانی‌تر، چندین کلیپ تولید کنید، کلیپ قبلی را به عنوان مرجع ضمیمه کنید و از Omni بخواهید تداوم را حفظ کند:

“Generate a 10-second clip that continues from the attached clip. Keep the subject, wardrobe and lighting identical. Hold the audio bed. Begin the camera move where the previous clip ended.”

برنامه Google Flow این فرآیند را با ارائه قابلیت زنجیره‌سازی کلیپ‌ها در سطح صحنه آسان می‌کند؛ در اپلیکیشن Gemini می‌توانید همین کار را به صورت دستی با استفاده از الگوی مرجع ضمیمه‌شده انجام دهید.

مرحله ۷ · خروجی، واترمارک و اثبات اصالت منبع

هر خروجی از Omni شامل موارد زیر است:

  • SynthID: یک واترمارک غیرقابل تشخیص از Google که در پیکسل‌ها و صدا ادغام شده است.
  • C2PA Content Credentials: متادیتا با استانداردهای باز که ویدیو را به عنوان تولید شده توسط Gemini شناسایی می‌کند.

شما می‌توانید هر خروجی از Omni را از طریق اپلیکیشن Gemini تأیید کنید، و قابلیت تأیید به زودی روی مرورگر Chrome و موتور جستجوی Google نیز ارائه خواهد شد. از دیدگاه یک سازنده محتوا کار اضافی برای انجام دادن وجود ندارد — نشان‌ها به صورت خودکار اضافه می‌شوند — اما دانستن وجود آن‌ها مفید است، به خصوص اگر در حال ارائه مجوز استفاده از ویدیوها به مشتریانی هستید که به افشای محتوای تولید شده توسط هوش مصنوعی اهمیت می‌دهند.

مرحله ۸ · آواتار هوش مصنوعی خود را تنظیم کنید (اختیاری)

اگر می‌خواهید Gemini Omni تصویر شما را به طور سازگار در چندین ویدیو نمایش دهد، یک بار AI Avatar را تنظیم کنید:

  1. بخش Avatar را در اپلیکیشن Gemini یا Google Flow باز کنید.
  2. دستورالعمل‌های روی صفحه را برای ثبت چهره و صدا دنبال کنید.
  3. شرایط استفاده را تأیید کنید — فقط شما می‌توانید از آواتار خود استفاده کنید.
  4. از آن به بعد، پرامپت‌ها می‌توانند بدون بارگذاری مجدد عکس‌ها، مستقیماً به “me” (من) یا “the avatar” (آواتار) اشاره کنند.

گوگل به وضوح اعلام کرده است که همچنان در حال تقویت اقدامات حفاظتی برای آواتار است، بنابراین در طول دوره‌های عرضه اولیه، انتظار برخی محدودیت‌های کشوری و ویژگی را داشته باشید.

اشتباهات رایج که باید از آن‌ها دوری کنید

  • نادیده گرفتن مراجع تصویری و عکس محصولات. پرامپت‌های متنی ساده سریع‌ترین راه برای هدر دادن اعتبار شما هستند.
  • تولید مجدد کامل (re-roll) به جای ویرایش. هر فرآیند تولید جدید هزینه بیشتری دارد و لاین صوتی خوبی را که از قبل کار می‌کرد، از بین می‌برد.
  • نادیده گرفتن مدت زمان. یک ویدیوی ۱۰ ثانیه‌ای همیشه پاسخ مناسبی نیست — یک لایو از محصول متمرکز و فشرده ۵ ثانیه‌ای ارزان‌تر، سریع‌تر و اغلب تأثیرگذارتر است.
  • فراموش کردن مدل فعال. اگر برای یک شات به Veo بروید و برای شات بعدی به Omni بازگردید، ممکن است تداوم سبک شما آسیب ببیند.

خلاصه کلام

استفاده درست از Gemini Omni در سال ۲۰۲۶ به معنای کشف تنظیمات مخفی نیست، بلکه به معنای برخورد با مدل مانند رفتاری است که یک کارگردان با گروه فیلم‌برداری خود دارد: یک خلاصه خلاقانه واضح بنویسید، به آن مراجع قوی بدهید، به جای فیلم‌برداری مجدد صحنه‌های کامل، اصلاحات تدریجی بخواهید، و کلیپ‌ها را به هم زنجیره کنید تا زمان پخش افزایش یابد. این چهار کار را به طور مداوم انجام دهید و مدل Omni Flash به زودی به سریع‌ترین راه برای انتشار ویدیوهای آماده انتشار در وب تبدیل خواهد شد.