Porque excluir variaveis correlacionadas ,ao invez de excluir as q tem pouca correlacao(perto de 0) , se elas sao correlacionadas, não significa q elas ajudam a explicar a outra variavel?
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Porque excluir variaveis correlacionadas ,ao invez de excluir as q tem pouca correlacao(perto de 0) , se elas sao correlacionadas, não significa q elas ajudam a explicar a outra variavel?
Boas Diego! Tudo bem? Espero que sim!
O que ocorre nece caso é que, para compreender-mos o modelo, realmente identificar variáveis com correlação alta nos ajuda a compreender melhor o prroblema.
Entretanto, para o modelo, variáveis muito correlacionadas devem ser excluídas pois elas podem enviesar o modelo dando mais 'peso' para essas variáveis que estão correlacionadas. Pense comigo, se estamos avaliando duas variáveis que explicam a mesma coisa, elas vão ter um peso muito grande no modelo (maior do que nós gostaríamos).
Para evitar esse enviesamento, as variáveis são excluídas.