Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Como retirar linhas com informações null

Para exercitar o aprendizado dos cursos de data science estou mexendo num dataset do kaggle como exercício.

Pegue o dataset do site https://www.kaggle.com/datasets/mayaravalliero/fire-watch-brazil-2024.

Fiz a importação dos cvs para os data frames e uni todos com o comando: dados = pd.concat([dados_q1, dados_q2, dados_q3, dados_q4], axis = 0).

Depois fiz abusca por valores nulos com dados.isnull().sum() e recebi a seguinte resposta:

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Depois fui verificar as informações nas linhas com valores nulos usando o comando: dados[dados['bioma'] == ''] e dados[dados['avg_frp'] == '']

Mas não retorna nenhuma linha.

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Estava tentando visualizar as linhas para ver que tipo de tratamento realizar, mas não consigo ver.

Até tentei usar o comando dados_sem_vazio = dados[dados_normalizados['avg_frp'] != ''].copy() para gerar um novo DF sem as linhas vazias, mas quando eu checo se ainda tem linhas nulas, dá o mesmo resultado de antes dados_sem_vazio.isnull().sum()

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Como eu faço para eliminar essas linhas com valores nulos?

1 resposta
solução!

Olá Henrique,

Possível Solução

Para remover corretamente as linhas com valores nulos (NaN) do seu DataFrame, o ideal é usar o método dropna() do pandas.

Você pode usar algo como:

dados_sem_nulos = dados.dropna(subset=['avg_frp'])

Explicação do erro:

O código abaixo não funcionou porque valores nulos não são iguais a "" (string vazia) — eles são do tipo NaN (que é obtido pelo np.NaN

dados['avg_frp'] == '' 

Ampliando dúvida

Se quiser eliminar todas as linhas que têm qualquer valor nulo em qualquer coluna, pode usar o código abaixo

dados_sem_nulos = dados.dropna()

OBS: Cuidado pois esse códugo elimina qualquer linha (row) do dataframe que contenha algum valor nulo independendo da coluna