1
resposta

[Dúvida] Correlação

Pessoal bom dia!! tenho uma duvida bastante pontual. Então, o professor falou que, nossas variáveis explicativas não podem ter uma alta correlação com as outras variáveis do nosso modelo, porque se não isso será ruim para o nosso modelo de treinamento.

Dito isso, queria saber o porque disso. desde já agradeço a compreensão!

1 resposta

Oi Ronaldd, tudo bem?

Se você tiver duas ou mais variáveis altamente correlacionadas no seu modelo, estas podem enviesar o resultado das previsões do seu modelo.

Pensando em um exemplo, se seu modelo tem como variáveis:

Altura, Peso e IMC

Este pode ser um caso em que pode fazer sentido remover do modelo a altura e o peso, pois os dois já estão representados no próprio IMC. (enquanto deixá-las, dependendo do cenário, isto pode influenciar o resultado, são 3 variáveis, que na prática significam essencialmente a mesma coisa, contribuindo para a previsão do modelo)

Espero ter ajudado.

=)