Na verdade não é por quanto tempo
, mas de quanto em quanto tempo
.
https://www.kubecost.com/kubernetes-autoscaling/kubernetes-hpa/
Once configured, the Horizontal Pod Autoscaler controller is in charge of checking the metrics and then scaling your replicas up or down accordingly. By default, HPA checks metrics every 15 seconds.
Então, a cada 15 segundos, as métricas são verificadas e os valores são diretamente usados. Se as métricas se referem a um conjunto de pods, é feita a média deles.
Mas sua lógica está certa: mesmo se nesse intervalo de 15 segundos as métricas variarem muito a ponto de alterar o número de réplicas a serem instanciadas, pode ocorrer o fenômeno de thrashing
ou flapping
:
https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping
Stability of workload scale
When managing the scale of a group of replicas using the HorizontalPodAutoscaler, it is possible that the number of replicas keeps fluctuating frequently due to the dynamic nature of the metrics evaluated. This is sometimes referred to as thrashing, or flapping. It's similar to the concept of hysteresis in cybernetics.