Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Dúvida] Dados correlação em valores normalizados

Em outros cursos que já fiz e documentações lidas, sempre vi que para se calcular a correlação dos dados afim de poder excluir variáveis muitos correlacionadas, era sempre indicado fazer a matriz de correlação antes de normalizar os dados, visto que a normalização pode alterar a escala dos dados e alterar o resultado.

Alguem consegue explicar pra mim? O instrutor no vídeo faz a correlação com os dados já normalizados

1 resposta
solução!

Olá Leonardo,

Você está certo. Em certa medida, normalizar os dados pode afetar o valor da correlação. Porém, a relação das entre as variáveis não é tao afetada pela normalização.

Se você calcular a correlação de dois gráficos com formas parecidas e escalas diferentes a correlação ainda vai ser alta. Pense em cada coluna do dataset como algo contínuo que pode ser plotado em um gráfico de linha. Se os dois gráficos tiverem formas parecidas vamos ter resultados de correlação alta mesmo que a escala tenha mudado um pouco.