Porque excluir variaveis correlacionadas ,ao invez de excluir as q tem pouca correlacao(perto de 0) , se elas sao correlacionadas, não significa q elas ajudam a explicar a outra variavel?
Porque excluir variaveis correlacionadas ,ao invez de excluir as q tem pouca correlacao(perto de 0) , se elas sao correlacionadas, não significa q elas ajudam a explicar a outra variavel?
Boas Diego! Tudo bem? Espero que sim!
O que ocorre nece caso é que, para compreender-mos o modelo, realmente identificar variáveis com correlação alta nos ajuda a compreender melhor o prroblema.
Entretanto, para o modelo, variáveis muito correlacionadas devem ser excluídas pois elas podem enviesar o modelo dando mais 'peso' para essas variáveis que estão correlacionadas. Pense comigo, se estamos avaliando duas variáveis que explicam a mesma coisa, elas vão ter um peso muito grande no modelo (maior do que nós gostaríamos).
Para evitar esse enviesamento, as variáveis são excluídas.