Estou no curso: Regressão linear: testando relações e prevendo resultados.
Quando vou informar o código: dados.corr().round(3), retorna com o erro. O que mais tenho que informar?
Estou no curso: Regressão linear: testando relações e prevendo resultados.
Quando vou informar o código: dados.corr().round(3), retorna com o erro. O que mais tenho que informar?
Oii, João! Tudo bem?
Agradeço por interagir por aqui postando a sua dúvida! E para buscarmos uma solução mais assertiva, poderia compartilhar, por favor, o erro que está retornando para você?
Oii, João! Obrigada por retornar a mensagem.
Esse erro geralmente acontece quando o método corr()
tenta converter um dado do tipo string em float, o que nem sempre é possível.
O método corr()
é usado para calcular a correlação entre colunas numéricas. Então o seu conjunto de dados contém colunas que não são numéricas (como datas ou strings), precisaremos remover ou ignorar essas colunas antes de calcular a correlação, pois nem sempre elas serão retiradas automaticamente.
Uma possível solução é selecionar apenas as colunas numéricas do nosso DataFrame usando o método select_dtypes
da biblioteca Pandas. Por exemplo:
dados_numericos = dados.select_dtypes(include='number')
correlacao = dados_numericos.corr().round(3)
No código acima, informamos ao select_dtypes
que só devem ser considerados as informações numéricas de dados
. Após armazená-las em uma variável, a utilizamos para gerar a correlação.
Adapte ao teu código e realize o teste, espero que dê certinho!
Caso queira conhecer o método select_dtypes
, deixo o link da documentação abaixo:
Bons estudos, João!