Boas Vítor!
Tudo bem?
Desculpe a demora em responder!
Essa é uma dúvida bastante importante quando trabalhamos com séries temporais. A frequência, que nas versões mais novas da biblioteca foi depreciada para o parâmetro period
é um valor arbitrário pelo qual será definida a sazonalidade dos dados. A escolha da frequência é especialmente relevante. Os nossos dados representam um período de 2 anos em meses, dessa forma, quando vêmos freq=1
, vemos a frequência mês a mês, freq=2
, por bimestre e assim por diante.
Quando vamos escolher esse número, precisamos prestar atenção em alguns pontos:
- Mesmo sendo arbitrário, ele deve ter uma explicação lógica. Em dados de bolsas de valores, por exemplo, que só funcionam em dias úteis, podemos usar o número 5 (dias de funcionamento na semana) ou 20 (dias de funcionamento no mês;
- Se a frequência ecolhida é X , a série temporal deverá ter ao menos 2x obervações, caso contrário dá erro pois não é possível gerar sazonalidade se não existem dois períodos de igual duração. Por isso que no caso da série apresentada no vídeo, que tem 24 meses, o valor máximo para a frequência é de 12;
- Quando aumentamos a frequência, diminuímos a quantidade de períodos que são comparados. No caso da serie do curso (chocolura), quando usamos uma frequência de 3, temos 8 comparações, enquanto quando temos uma frequência de 12, apenas 2. Por esse motivo não é possível gerar medidas de frequência e ruído para todo o período.
Deixo abaixo alguns links que me ajudaram nessa pesquisa, mas que só estão disponíveis em inglês:
https://towardsdatascience.com/time-series-decomposition-and-statsmodels-parameters-69e54d035453
https://otexts.com/fpp2/classical-decomposition.html
Espero ter ajudado!
Bons estudos!