Estimativa custo API Gemini Omni 2026: preços por-segundo, por-vídeo, por-projeto
Quanto vai realmente custar a API Gemini Omni em 2026? Projeções preço por-segundo, totais por-vídeo e exemplos calculados para 5 tamanhos projeto reais do indie ao enterprise.
Por que estimar agora
A API Gemini Omni está em preview fechado no I/O 2026. O pricing público não caiu, mas existem sinais suficientes — taxas Vertex AI Veo 3.1, framing keynote do Sundar Pichai, discussões desenvolvedor — para fazer projeção custo defensável. Se você escopeia um projeto 2026 H2, este guia te dá a matemática.
Para contexto estratégico, emparelhe isso com o guia desenvolvedor Gemini Omni API e a comparação preços.
Taxas projetadas por-segundo (banda preview)
| Tier | $/seg @ 720p | $/seg @ 1080p | Áudio incluído |
|---|---|---|---|
| Preview (closed beta) | $0.30 | $0.50 | Sim, nativo |
| GA (projetado H2 2026) | $0.20 | $0.30 | Sim, nativo |
| Contrato volume (1M+ seg/mês) | $0.10 | $0.18 | Sim, nativo |
Para comparação, a taxa Vertex AI Veo 3.1 ao vivo é $0.75/seg @ 1080p. A vantagem estrutural do Omni é que áudio é renderizado na mesma forward pass — Veo cobra por vídeo e aumentação áudio separadamente.
Escala custo por-vídeo
Calculado à taxa GA projetada de $0.30/seg @ 1080p, com imposto regeneração 1.4× padrão embutido (assume primeira tentativa não shippable 40% do tempo):
| Comprimento clipe | Custo base | Com imposto regen (1.4×) |
|---|---|---|
| 5s | $1.50 | $2.10 |
| 8s | $2.40 | $3.36 |
| 10s | $3.00 | $4.20 |
| 15s (Pro) | $4.50 | $6.30 |
| 30s (Pro) | $9.00 | $12.60 |
Assunção razoável para clipes 8-seg 1080p em produção: ~$3.40 por clipe shippable em preços GA.
Exemplo 1: criador indie (50 clipes/mês)
Criador solo postando Reels e Shorts diários.
- 50 clipes × 8s × $0.30/seg = $120
- Imposto regen (1.4×): $168
- Taxas base API (assumidas): $0
- Total mensal: ~$170
Veredicto: não use a API. Fique no Google AI Plus ($9.99/mês) ou Pro ($19.99/mês). A API só bate a assinatura acima de ~150 clipes/mês.
Exemplo 2: marca e-commerce (300 clipes/mês)
Marca DTC rodando vídeo produto em escala através de PDPs e anúncios.
- 300 clipes × 8s × $0.30/seg = $720
- Imposto regen (1.4×): $1,008
- Storage + CDN: ~$50
- Tempo engineering (~10h/mês @ blended $80/h): $800
- Total mensal: ~$1,860
Veredicto: ainda apertado contra Google AI Ultra ($125/mês) + workflow manual. A API ganha quando você precisa de geração programática por-SKU (1 clipe por produto, atualizado semanalmente).
Exemplo 3: agência (1,000 clipes/mês, multi-cliente)
Agência mid-size com 8 contas cliente, entregáveis mistos.
- 1,000 clipes × méd 9s × $0.30/seg = $2,700
- Imposto regen (1.4×): $3,780
- Storage + CDN: $200
- Tempo engineering (~40h/mês): $3,200
- Margem (40% sobre custo direto): $4,072
- Faturável mensal: ~$11,250
Veredicto: API é a arquitetura certa. Construa um pipeline Slack-triggered que dropa clipes finalizados em pastas cliente. Cobre por-clipe ($15-25) ou por-pacote mensal.
Exemplo 4: plataforma SaaS (50K clipes/mês, embedded)
Plataforma UGC deixando usuários renderizarem vídeos avatar.
- 50,000 clipes × 6s × $0.20/seg (taxa volume) = $60,000
- Imposto regen (1.4×): $84,000
- Negociação contrato volume: ~30% off → $58,800
- Infra (S3, CDN, queue, observability): $4,000
- Tempo engineering (3 FTEs alocados): $25,000
- Total mensal: ~$87,800
Veredicto: modelo receita deve clear $1.76/clipe média ($87.8K / 50K). Cobre usuários $0.99/crédito e bundle em plano “20 créditos” $19/mês. Margem emerge de assinantes idle.
Exemplo 5: broadcaster enterprise (200 clipes/mês, premium)
Streamer produzindo conteúdo suplementar AI-gerado para shows.
- 200 clipes × 15s (tier Pro projetado) × $0.50/seg = $1,500
- Imposto regen (1.4×, barra qualidade mais alta então +0.2×): $2,400
- Compliance e review (1 FTE alocado): $12,000
- Clearance legal/direitos por asset: $200 × 200 = $40,000
- Total mensal: ~$54,400
Veredicto: custo API é ruído. As linhas dominantes são compliance e clearance direitos. Decisão API é “sim” para qualquer broadcaster construindo workflows AI; a questão custo é operacional, não técnica.
Categorias custo ocultas que maioria estimativas perdem
- Storage imagem referência — cada geração clipe referencia 1-4 imagens. Para mês 10K clipes, são 30K+ imagens para hostear, versionar, servir rápido.
- Audit + verificação watermark — metadata Google SynthID + C2PA são grátis para gerar, mas pipelines audit enterprise que checam cada output adicionam custo CPU.
- Contabilidade geração-falhada — Omni rejeitará prompts violando política safety. Construa orçamentos retry a 1.05× para falhas safety-induzidas.
- Cold-start multi-região — se você serve usuários global, latência regional requer réplicas hot. Plane para 1.5× compute quando for global.
- Mitigações latência UX voltada-cliente — long polling, UIs progresso, animações fallback. Nada disso é custo Omni, mas é custo projeto.
Como orçar sem pricing GA
Até Google publicar taxas GA, use estes placeholders no seu modelo:
- Por-segundo 1080p: $0.30 (best case), $0.50 (worst case)
- Por-segundo 720p: $0.20 (best case), $0.35 (worst case)
- Multiplicador regen: 1.4×
- Compute auxiliar (storage + CDN): 8% do custo compute
- Engineering ops: 1 FTE por 10K clipes/mês
Conservadores o suficiente que você provavelmente virá sob orçamento quando preços reais aterrissarem.
Quando renegociar
Se seu volume projetado é >500K segundos/mês (~62.5K clipes de 8s cada), abra conversação direta com Google Cloud sales tão logo a API hit GA. Descontos volume padrão Vertex chutam a este limite. Espere 25-40% off lista quando committed por 12 meses.
Conclusão
Não espere o preço GA API para planejar. Use a projeção $0.30/seg @ 1080p como sua baseline, layer o imposto regen 1.4× em cima e orce engineering a 1 FTE por 10K clipes/mês. Maioria projetos encontrarão a API mais barata que esperado — e maioria times sobregastarão em engineering até perceberem o prompt é o produto.