Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

duvida P>|t| e Prob (F-statistic)

Se para um modelo eu adotar um nível de significância de 0.05 e alguma das minhas variáveis isoladamente tiverem um P>|t| >= 0.05 porém o Prob (F-statistic) for < = 0.05 eu deveria retirar essa variável do modelo ? Tenho uma situação onde duas das variáveis explicativas possuem uma relação alta entre elas, então acabei tirando elas, porém o dataset é pequeno e retirando mais variáveis o R-squared decai mais ainda. Gostaria de criar um simulador, e seria interessante eu ter essas variáveis, alguém sabe o que eu poderia fazer?

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

1 resposta
solução!

Olá Gabriela, tudo bem? Espero que sim!

É recomendável utilizar somente as variáveis cujo parâmetro encontrado seja estatisticamente significativo. Você pode fazer testes e remover apenas uma das variáveis e verificar se a outra variável se tornou estatisticamente significativa, já que o resultado do teste depende de todas as variáveis ao mesmo tempo, então ao acrescentar ou remover alguma das variáveis, os resultados de todos os testes são alterados.

A estatística F é uma estatística mais geral que indica se o modelo é estatisticamente significativo, porém é ideal checar o teste para cada uma das variáveis. O único caso que você não pode remover o parâmetro é para o intercepto. Ainda que o resultado do teste para o intercepto não seja significativo, você deve manter o parâmetro para não criar um viés no seu modelo.

Portanto, faça diferentes testes com combinações de variáveis (acrescentando ou removendo) e escolha aquele modelo em que os parâmetros sejam estatisticamente significativos e obtenha o melhor R² ajustado, uma vez que o R² ajustado é o parâmetro indicado para comparar diferentes modelos.

Bons estudos!