Estimación coste API Gemini Omni 2026: precios por-segundo, por-vídeo, por-proyecto
¿Cuánto costará realmente la API Gemini Omni en 2026? Proyecciones precio por-segundo, totales por-vídeo y ejemplos resueltos para 5 tamaños proyecto reales de indie a enterprise.
Por qué estimar ahora
La API Gemini Omni está en preview cerrado en I/O 2026. El pricing público no ha caído, pero existen suficientes señales — tarifas Vertex AI Veo 3.1, framing keynote de Sundar Pichai, discusiones de desarrolladores — para hacer una proyección coste defendible. Si estás scopeando un proyecto 2026 H2, esta guía te da las matemáticas.
Para contexto estratégico, empareja esto con la guía desarrollador Gemini Omni API y la comparación pricing.
Tarifas proyectadas por-segundo (banda preview)
| Tier | $/seg @ 720p | $/seg @ 1080p | Audio incluido |
|---|---|---|---|
| Preview (closed beta) | $0.30 | $0.50 | Sí, nativo |
| GA (proyectado H2 2026) | $0.20 | $0.30 | Sí, nativo |
| Contrato volumen (1M+ seg/mes) | $0.10 | $0.18 | Sí, nativo |
Para comparación, la tarifa Vertex AI Veo 3.1 en vivo es $0.75/seg @ 1080p. La ventaja estructural de Omni es que el audio se renderiza en el mismo forward pass — Veo cobra por vídeo y aumentación audio por separado.
Escala coste por-vídeo
Calculado a la tarifa GA proyectada de $0.30/seg @ 1080p, con el impuesto regeneración 1.4× estándar incluido (asume primer intento no shippable 40% del tiempo):
| Longitud clip | Coste base | Con impuesto regen (1.4×) |
|---|---|---|
| 5s | $1.50 | $2.10 |
| 8s | $2.40 | $3.36 |
| 10s | $3.00 | $4.20 |
| 15s (Pro) | $4.50 | $6.30 |
| 30s (Pro) | $9.00 | $12.60 |
Asunción razonable para clips 8-seg 1080p en producción: ~$3.40 por clip shippable a precios GA.
Ejemplo 1: creador indie (50 clips/mes)
Creador solo posteando Reels y Shorts diarios.
- 50 clips × 8s × $0.30/seg = $120
- Impuesto regen (1.4×): $168
- Tarifas base API (asumidas): $0
- Total mensual: ~$170
Veredicto: no uses la API. Quédate en Google AI Plus ($9.99/mes) o Pro ($19.99/mes). La API solo bate la suscripción por encima de ~150 clips/mes.
Ejemplo 2: marca e-commerce (300 clips/mes)
Marca DTC corriendo vídeo producto a escala a través de PDPs y anuncios.
- 300 clips × 8s × $0.30/seg = $720
- Impuesto regen (1.4×): $1,008
- Storage + CDN: ~$50
- Tiempo engineering (~10h/mes @ blended $80/h): $800
- Total mensual: ~$1,860
Veredicto: aún apretado contra Google AI Ultra ($125/mes) + workflow manual. La API gana cuando necesitas generación programática por-SKU (1 clip por producto, refrescado semanalmente).
Ejemplo 3: agencia (1,000 clips/mes, multi-cliente)
Agencia mid-size con 8 cuentas cliente, deliverables mixtos.
- 1,000 clips × prom 9s × $0.30/seg = $2,700
- Impuesto regen (1.4×): $3,780
- Storage + CDN: $200
- Tiempo engineering (~40h/mes): $3,200
- Margen (40% sobre coste directo): $4,072
- Facturable mensual: ~$11,250
Veredicto: API es la arquitectura correcta. Construye un pipeline Slack-triggered que dropea clips terminados en carpetas cliente. Cobra por-clip ($15-25) o por-paquete mensual.
Ejemplo 4: plataforma SaaS (50K clips/mes, embedded)
Plataforma UGC dejando a usuarios renderizar vídeos avatar.
- 50,000 clips × 6s × $0.20/seg (tarifa volumen) = $60,000
- Impuesto regen (1.4×): $84,000
- Negociación contrato volumen: ~30% off → $58,800
- Infra (S3, CDN, queue, observability): $4,000
- Tiempo engineering (3 FTEs asignados): $25,000
- Total mensual: ~$87,800
Veredicto: modelo ingresos debe clear $1.76/clip promedio ($87.8K / 50K). Cobra usuarios $0.99/crédito y bundle en plan “20 créditos” $19/mes. Margen emerge de suscriptores idle.
Ejemplo 5: broadcaster enterprise (200 clips/mes, premium)
Streamer produciendo contenido suplementario AI-generado para shows.
- 200 clips × 15s (tier Pro proyectado) × $0.50/seg = $1,500
- Impuesto regen (1.4×, barra calidad más alta así +0.2×): $2,400
- Compliance y review (1 FTE asignado): $12,000
- Clearance legal/derechos por asset: $200 × 200 = $40,000
- Total mensual: ~$54,400
Veredicto: coste API es ruido. Las líneas dominantes son compliance y clearance derechos. Decisión API es “sí” para cualquier broadcaster construyendo workflows AI; la pregunta coste es operacional, no técnica.
Categorías coste ocultas que mayoría estimaciones pierden
- Storage imagen referencia — cada generación clip referencia 1-4 imágenes. Para mes 10K clips, son 30K+ imágenes a hostear, versionar, servir rápido.
- Audit + verificación watermark — metadata Google SynthID + C2PA son gratis de generar, pero pipelines audit enterprise que chequean cada output añaden coste CPU.
- Contabilidad generación-fallida — Omni rechazará prompts violando política safety. Construye presupuestos retry a 1.05× para fallos safety-inducidos.
- Cold-start multi-región — si sirves usuarios global, latencia regional requiere réplicas hot. Plan para 1.5× compute cuando vayas global.
- Mitigaciones latencia UX cara-cliente — long polling, UIs progreso, animaciones fallback. Nada de esto es coste Omni, pero es coste proyecto.
Cómo presupuestar sin pricing GA
Hasta que Google publique tarifas GA, usa estos placeholders en tu modelo:
- Por-segundo 1080p: $0.30 (best case), $0.50 (worst case)
- Por-segundo 720p: $0.20 (best case), $0.35 (worst case)
- Multiplicador regen: 1.4×
- Compute auxiliar (storage + CDN): 8% del coste compute
- Engineering ops: 1 FTE por 10K clips/mes
Conservadores suficiente que probablemente vendrás bajo presupuesto cuando precios reales aterricen.
Cuándo renegociar
Si tu volumen proyectado es >500K segundos/mes (~62.5K clips de 8s cada uno), abre conversación directa con Google Cloud sales tan pronto la API hit GA. Descuentos volumen estándar Vertex patean a este umbral. Espera 25-40% off lista cuando committed por 12 meses.
Conclusión
No esperes el precio GA API para planear. Usa la proyección $0.30/seg @ 1080p como tu baseline, capa el impuesto regen 1.4× encima y presupuesta engineering a 1 FTE por 10K clips/mes. Mayoría proyectos encontrarán la API más barata de lo esperado — y mayoría teams sobregastarán en engineering hasta darse cuenta el prompt es el producto.