Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

[Dúvida] Como escolher quantos lags para ACF e PACF.

Na aula construindo um modelo Autorregressivo foi feito os graficos de autocorrelação e autocorrelação parcial da série temporal, como foi feita a escolha dos lags para os gráficos, como sei se devo escolher mais ou menos lags?

2 respostas
solução!

Olá, Janaina! Tudo bem?

A escolha da quantidade de lags nos gráficos de ACF (autocorrelação) e PACF (autocorrelação parcial) não é totalmente aleatória. Ela depende do comportamento que queremos observar na série temporal e serve principalmente para permitir a visualização de possíveis padrões de dependência entre os valores ao longo do tempo.

Um dos fatores que pode influenciar essa escolha é a frequência e possível sazonalidade da série. Por exemplo, em dados mensais, caso exista suspeita de sazonalidade anual, é interessante observar pelo menos 12 ou mais lags para conseguir enxergar esse ciclo. Na aula, foi utilizado lags = 20 justamente para permitir uma janela de observação suficiente para identificar onde as correlações deixam de ser significativas.

Também existe um equilíbrio (trade-off) na escolha da quantidade de lags:

  • Poucos lags: podem esconder padrões importantes que aparecem apenas em períodos mais distantes da série.

  • Muitos lags: podem deixar o gráfico mais difícil de interpretar, pois passam a aparecer muitas correlações pequenas ou ruídos.

Uma forma de avaliar isso é observando o próprio gráfico gerado:

  • Aumente os lags se, próximo ao final do gráfico, ainda existirem barras relevantes fora da área azul (intervalo de confiança), indicando que ainda há correlação significativa em lags maiores.

  • Mantenha ou reduza os lags se, a partir de certo ponto, todas as barras já estiverem dentro da área azul, indicando que a dependência temporal da série termina ali.

No exemplo apresentado na aula, o valor da ordem p foi definido como 14, pois esse foi o último lag significativo na PACF antes de os valores entrarem e permanecerem na área de insignificância. Se tivéssemos observado apenas 10 lags, por exemplo, não conseguiríamos identificar que o lag 14 ainda tinha influência na série.

💡 Dica: é comum testar valores como 10, 20 ou 30 lags apenas para visualizar melhor o comportamento da série. O mais importante é que o gráfico permita identificar claramente onde a correlação deixa de ser significativa.

Qualquer dúvida que surgir, compartilhe no fórum.

Abraços e bons estudos!

Para saber mais:

Sugestão de conteúdo:

O link está em inglês, mas você poderá utilizar a tradução automática do navegador

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Excelente explicação, muito obrigada Monalisa.