Nesta aula, é feito interpretação dos dados em forma de gráficos. Como posso fazer a mesma análise sem usar gráficos?
Obrigado!
Nesta aula, é feito interpretação dos dados em forma de gráficos. Como posso fazer a mesma análise sem usar gráficos?
Obrigado!
Olá Pietro, tudo bem? Espero que sim!
Você pode avaliar o critério de homocedasticidade e heterocedasticidade através de testes estatísticos. É um jeito mais formal de se realizar a análise e é mais recomendada. Existem diversos testes para avaliar esse critério, como o teste de Park, o teste de Goldfeld–Quandt e o teste de Breusch–Pagan.
Podemos realizar o teste Goldfeld-Quandt ou de Breusch-Pagan utilizando a biblioteca statsmodels. Ambos têm como hipótese nula a homocedasticidade, em que para valores de p < 0.05, a homocedasticidade é rejeitada ao nível de significância de 5%.
Os parâmetros a serem passados para a função são os resíduos e o valor estimado.
Para utilizar a biblioteca statsmodels, é necessário realizar a instalação através do comando !pip install statsmodels
em uma célula do notebook.
Após a instalação, podemos importar a biblioteca para utilização dos testes com os comandos:
import statsmodels.api as sm
import statsmodels.stats.api as sms
O primeiro import será usado para adicionar uma coluna de constantes ao y_previsto_train, que é necessário para o statsmodels reconhecer o intercepto corretamente. Isso pode ser melhor entendido em outro tópico aqui no fórum, no qual respondi: Tópico Constante 1.
O segundo import é utilizado para utilizar os testes. Vou deixar como exemplo o código de uso do teste de Goldfeld–Quandt:
y_previsto_train = sm.add_constant(y_previsto_train)
sms.het_goldfeldquandt(residuo,y_previsto_train)
Os testes podem apresentar resultados distintos, uma vez que são baseados em estudos diferentes.
Qualquer dúvida estou à disposição.
Bons estudos!
João,
Agradeço as respostas detalhadas e esclarecedoras de sempre. Irei estudar as documentações mencionadas e os cálculos em questão para entender um pouco melhor, pois ainda permanece, sob o ponto de vista conceitual, um pouco abstrato. Sabendo que estes testes suprem a mesma análise da aula agora é minha tarefa em tentar entender o melhor possível a lógica subjacente. Obrigado pela ajuda de sempre.
Você sabe informar se o curso do Guilherme sobre testes estatísticos aborda estes cálculos em maiores detalhes? Obrigado! Abraços
Olá Pietro, tudo bem? Espero que sim!
O curso do Guilherme não aborda esses testes específicos que mencionei, mas aborda como utilizar os testes estatísticos de uma forma geral e isso é bem útil, já que os testes de hipóteses funcionam de uma forma muito parecida, diferindo qual será a hipótese nula e alternativa e a estatística de teste.
Além do curso do Guilherme, há o curso Estatística com Python parte 3: Testes de hipóteses da formação Estatística com Python que aborda esses conceitos.
Estou à disposição para ajudar. Bons estudos!