1
resposta

[Dúvida] Como encontrar células vazias se não é valor nulo?

Por exemplo, se o meu banco de dados for muito extenso e não der para verificar se existe valor vazio (no entanto, não nulo) pela técnica do loop da coluna a seguir:

for col in desafio2_normalizado.columns:
    print(f"Coluna: {col}")
    print(desafio2_normalizado[col].unique())
    print("-" * 30)

Como posso encontrar as células vazias?

1 resposta

Ei, Ádria! Tudo bom?

Agradeço por aguardar o nosso retorno.

Uma sugestão é substituir strings vazias ou com apenas espaços por NaN e usar isna() para contá-las. Isso é rápido, escalável e padroniza o tratamento de dados.

Exemplo:

import numpy as np

desafio2_normalizado = desafio2_normalizado.replace(r'^\s*$', np.nan, regex=True)

print("Células vazias por coluna:")
print(desafio2_normalizado.isna().sum())

No exemplo acima, o replace(r'^\s*$', np.nan, regex=True) foi usado para converter strings vazias ou com espaços em NaN. E depois é usado isna().sum() para mostrar a quantidade de valores vazios (NaN) por coluna.

As páginas estão em inglês, se prefere ler em português, recomendo usar o tradutor automático do navegador.

Conte sempre com a nossa ajuda aqui no fórum, Ádria.

Até mais!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado!