Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Balanceamento de Carga nos Services

Sobre esta parte do texto:
"Mesmo com uma fração de vCPU, o Cloud Run ainda escala automaticamente o número de instâncias de acordo com a demanda. Portanto, se o número de requisições aumentar, o Cloud Run criará mais instâncias, mesmo com a simultaneidade desativada, garantindo a capacidade de atender à demanda, mas mantendo o custo por instância baixo."

Segue a pergunta abaixo:
Os services possuem um mecanismo de balanceamento automático de carga, capaz de iniciar novas instâncias quando necessário, semelhante ao que acontece com as máquinas virtuais quando criamos um balanceamento? Nas VMs precisávamos configurar um balanceamento manualmente, já nos services, esse balanceamento é automático? Temos como configurar este balanceamento nos services?

1 resposta
solução!

Oii, tudo bem?

Sua dúvida é muito boa, Lorenzo!

Cloud Run e balanceamento de carga:
Nos Services do Cloud Run, o balanceamento de carga já é automático. Você não precisa configurar manualmente como faria com máquinas virtuais (VMs) e um load balancer separado. Isso acontece porque o Cloud Run é um serviço serverless gerenciado: ele distribui as requisições entre as instâncias disponíveis do seu contêiner de forma nativa.

Como funciona na prática?

  • Escalonamento automático: quando chegam novas requisições e não há instâncias disponíveis, o Cloud Run cria novas instâncias automaticamente.
  • Distribuição de requisições: as requisições são direcionadas para as instâncias já ativas. Se a simultaneidade estiver ativada (>1), a mesma instância pode atender várias requisições ao mesmo tempo. Se estiver desativada (=1), o Cloud Run distribui cada requisição para uma instância separada.
  • Sem configuração extra: você não precisa criar nem configurar manualmente um balanceador de carga como faria em VMs. Essa camada já está embutida no funcionamento do Cloud Run.

É possível configurar o balanceamento?

O que você pode ajustar são alguns parâmetros que afetam como o balanceamento se comporta:

  • Simultaneidade (quantas requisições cada instância atende ao mesmo tempo).
  • Limites de instâncias (mínimo e máximo de instâncias para o serviço).
  • Alocação de CPU/memória (influencia quantas requisições cada instância consegue suportar bem).

Nos Services do Cloud Run, o balanceamento de carga é automático e faz parte da própria plataforma. Diferente das VMs, você não precisa configurar manualmente um load balancer. Sua responsabilidade é apenas ajustar os limites e recursos do serviço para que ele atenda bem à demanda.

Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!