Durante o acompanhamento do HPA --watch , vi que em determinado momento tínhamos apenas 1 pod em execução, mas no deployment havíamos definido no mínimo 3 pods.
Acompanhando uma outra discussão aqui no fórum, vi que um colega questionou o porque definir o número de réplicas no deployment e também no HPA e a resposta do professor foi que em caso de falha do HPA, ainda teríamos o deployment gerenciando o número de réplicas.
A minha observação é: o HPA irá sobrepor o deployment neste quesito? Qual critério o Kubernetes usa para determinar de fato o número de réplicas, uma vez que definimos isso de forma distinta em manifestos diferentes?
Pesquisando um pouco e questionando ao ChatGPT, encontrei a seguinte resposta:
"O comportamento observado será que o HPA tentará manter pelo menos 3 réplicas, mas o Deployment/ReplicaSet manterá apenas 1 réplica, criando um desequilíbrio entre as configurações e possivelmente comprometendo a capacidade de resposta da aplicação em momentos de alta demanda."
"É importante garantir que as configurações de número mínimo de réplicas sejam coerentes entre o HPA e o Deployment/ReplicaSet para evitar conflitos e comportamentos inesperados. Em muitos casos, faz sentido que o número mínimo de réplicas definido no HPA seja igual ou menor do que o número mínimo de réplicas no Deployment/ReplicaSet para que ambas as configurações estejam alinhadas."