Oi, Bruno! Tudo bem com você?
A correlação dessas variáveis não é 1.99
, explicando melhor, nesse momento da aula o instrutor utiliza o seguinte código:
matriz_correlacao_v1 = matriz_correlacao[matriz_correlacao>0.99]
matriz_correlacao_v2 = matriz_correlacao_v1.sum()
variaveis_correlacionadas = matriz_correlacao_v2[matriz_correlacao_v2>1]
variaveis_correlacionadas
O qual, após coletar apenas os valores de correlação acima de 0.99
, é feita a soma de todas as correlações por variáveis e depois busca apenas as variáveis que tiveram uma soma acima de 1
, coletando assim, apenas as variável altamente correlacionadas.
Desse modo, como é uma soma de valores de correlação, é normal que se existam valores acima de 1
na variável variaveis_correlacionadas
.
Bons estudos!