Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Dúvida: NaN

Olá pessoal!

Estava testando retirar os NaN's da tabela, porém, na hora de somar/agrupar por país percebi que a minha tabela retornou apenas alguns países (imagem abaixo), ou seja, retirou todos os outros restantes quando usei o dropna( ). Há alguma maneira de eu retirar os NaN's sem que isso afete a somatória de casos/países? Ou nesse caso em específico vou precisar usar os dados que tenho mesmo com os NaN? Obrigada!

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

2 respostas
solução!

Olá! Tudo bem com você?

Se a única alteração que você fez no DataFrame foi remover valores nulos com dropna(), pode ser que como temos vários valores NaN, ao excluir a linha que continham esses valores também excluímos vários países. Devemos ter muito cuidado ao tratar valores NaN porque em alguns casos podemos perder muitos dados importantes para a análise.

Então sempre precisamos entender como os valores NaN podem impactar na análise pois assim, descobrimos uma melhor forma de tratar eles. Por exemplo, tendo uma coluna no banco que esteja com mais de 30% ou 40% dos dados como valores nulos, teríamos uma alta quantidade de dados nulos em uma única coluna, por isso perderíamos muitos dados do conjunto de dados se fossemos apenas remover todas as linhas que têm valores nulos, faria então mais sentido remover toda a coluna que está com valores nulos.

Além desse exemplo existem vários outros problemas e análises de impacto de valores NaN, por isso sugiro a leitura do artigo Tratamento e Transformação de Dados NaN: Uma visão geral e prática que traz uma boa abordagem de como analisar e tratar valores NaN com python pandas. Pode ser que algumas das soluções que ele informa sejam mais interessantes para sua análise ;-)

Espero ter te ajudado. Bons estudos!

Oi, Mirla!

Ajudou bastante e o artigo complementou. Muito obrigada!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software