1
resposta

Correlação Linear entre -1 e 1.

As features exame1, exame3, exame22 e exame24 apresentaram os valores de correlação de 1.99.

Sabendo que o coeficiente de correlação linear varia entre -1 e 1, não seria inapropriado esse valor de 1.99?

O que poderia ter causado essa impropriedade?

Obrigado!

1 resposta

Oi, Bruno! Tudo bem com você?

A correlação dessas variáveis não é 1.99, explicando melhor, nesse momento da aula o instrutor utiliza o seguinte código:

matriz_correlacao_v1 =  matriz_correlacao[matriz_correlacao>0.99]
matriz_correlacao_v2 = matriz_correlacao_v1.sum()
variaveis_correlacionadas = matriz_correlacao_v2[matriz_correlacao_v2>1]
variaveis_correlacionadas

O qual, após coletar apenas os valores de correlação acima de 0.99, é feita a soma de todas as correlações por variáveis e depois busca apenas as variáveis que tiveram uma soma acima de 1, coletando assim, apenas as variável altamente correlacionadas.

Desse modo, como é uma soma de valores de correlação, é normal que se existam valores acima de 1 na variável variaveis_correlacionadas.

Bons estudos!