Na aula construindo um modelo Autorregressivo foi feito os graficos de autocorrelação e autocorrelação parcial da série temporal, como foi feita a escolha dos lags para os gráficos, como sei se devo escolher mais ou menos lags?
Na aula construindo um modelo Autorregressivo foi feito os graficos de autocorrelação e autocorrelação parcial da série temporal, como foi feita a escolha dos lags para os gráficos, como sei se devo escolher mais ou menos lags?
Olá, Janaina! Tudo bem?
A escolha da quantidade de lags nos gráficos de ACF (autocorrelação) e PACF (autocorrelação parcial) não é totalmente aleatória. Ela depende do comportamento que queremos observar na série temporal e serve principalmente para permitir a visualização de possíveis padrões de dependência entre os valores ao longo do tempo.
Um dos fatores que pode influenciar essa escolha é a frequência e possível sazonalidade da série. Por exemplo, em dados mensais, caso exista suspeita de sazonalidade anual, é interessante observar pelo menos 12 ou mais lags para conseguir enxergar esse ciclo. Na aula, foi utilizado lags = 20 justamente para permitir uma janela de observação suficiente para identificar onde as correlações deixam de ser significativas.
Também existe um equilíbrio (trade-off) na escolha da quantidade de lags:
Poucos lags: podem esconder padrões importantes que aparecem apenas em períodos mais distantes da série.
Muitos lags: podem deixar o gráfico mais difícil de interpretar, pois passam a aparecer muitas correlações pequenas ou ruídos.
Uma forma de avaliar isso é observando o próprio gráfico gerado:
Aumente os lags se, próximo ao final do gráfico, ainda existirem barras relevantes fora da área azul (intervalo de confiança), indicando que ainda há correlação significativa em lags maiores.
Mantenha ou reduza os lags se, a partir de certo ponto, todas as barras já estiverem dentro da área azul, indicando que a dependência temporal da série termina ali.
No exemplo apresentado na aula, o valor da ordem p foi definido como 14, pois esse foi o último lag significativo na PACF antes de os valores entrarem e permanecerem na área de insignificância. Se tivéssemos observado apenas 10 lags, por exemplo, não conseguiríamos identificar que o lag 14 ainda tinha influência na série.
💡 Dica: é comum testar valores como 10, 20 ou 30 lags apenas para visualizar melhor o comportamento da série. O mais importante é que o gráfico permita identificar claramente onde a correlação deixa de ser significativa.
Qualquer dúvida que surgir, compartilhe no fórum.
Abraços e bons estudos!
O link está em inglês, mas você poderá utilizar a tradução automática do navegador
Excelente explicação, muito obrigada Monalisa.