Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

from statsmodels.graphics.tsaplots import plot_pacf

essa análise é feita tão somente plotando gráficos, mas gostaria de saber como uso essa ferramenta através de matemática e dataframes, sem depender dos gráficos, já que no meu caso eu não enxergo. O ideal é sempre passar as duas opções: a visual e a não visual.

2 respostas

Oi Pietro. Desculpe a demora na resposta. Com certeza vou levar essa questão de adicionar opções não visuais quando for gravar ou regravar um curso.

No caso da autocorrelação total e parcial temos a opção de gerar apenas os valores da conta em um array. Para o exemplo da base de dados carbonico você pode usar a sequência de comandos a seguir:


from statsmodels.tsa.stattools import acf, pacf

autocorrelacao = acf(carbonico,nlags=20,fft=True)

autocorrelacao_parcial = pacf(carbonico,nlags=20)

Imprimindo os valores da variável autocorrelacao você deve comparar cada um dos valores obtidos. Normalmente os valores das posições zero e um são mais altos. Porém, no caso da autocorrelação da base carbonico os valores continuam altos, em um intervalo próximo do 0.9 ou 0.8. Isso acontece por causa da sazonalidade. A mesma informação está se repetindo de tempos em tempos na série temporal.

Na autocorrelação parcial após o lag=1 os valores caem para um intervalo bem mais baixo. Neste caso, a interpretação de sazonalidade é mais difícil. Mas o que eu também tentei passar é que existe um padrão no comportamento das funções de autocorrelação total e parcial. A interpretação desse padrão é difícil tanto visualmente quanto em texto.

O importante aqui é guardar a informação de que se existem valores altos de autocorrelação total e parcial em lags mais altos isso significa que temos informação relevante em lags mais altos. Assim, pode ser necessário utilizar modelos autoregressivos e de média móvel de ordem mais alta também.

Nas aulas seguintes vamos utilizar o autoarima. Esse pacote faz a busca automática da ordem dos modelos autoregressivos e de média móvel. Apesar disso, somos nós que definimos o intervalo de busca. Por isso, interpretar os valores da autocorrelação e autocorrelação parcial continua sendo interessante.

solução!

Sua explicação foi perfeita, Allan. Obrigadíssimo! Consegui ler e entender tudo. E magina, não precisa pedir desculpas pela demora. Estou fazendo esse curso porque confesso que só com o módulo do bootcamp ainda fiquei com muitas dúvidas. Esse curso me ajudou bastante, e com essas contribuições suas ainda mais. Abraços