Na empresa onde trabalho, o load balance é feito dentro da applicação que contém os microserviços. Por exemplo, eu posso subir max replicas ou descer para cada serviço especifico. O Nosso API GTW não faz esse controle.
A minha dúvida é justamente essa: onde é mais recomendável fazer o load balance? Em cada sistema (microservice) ou dentro do API GTW como foi mostrado pela instrutora?
PS: não precisa responder dizendo que depende de cada empresa, blá blá (isso é óbvio).