Ei, Ádria! Tudo bom?
Agradeço por aguardar o nosso retorno.
Uma sugestão é substituir strings vazias ou com apenas espaços por NaN
e usar isna()
para contá-las. Isso é rápido, escalável e padroniza o tratamento de dados.
Exemplo:
import numpy as np
desafio2_normalizado = desafio2_normalizado.replace(r'^\s*$', np.nan, regex=True)
print("Células vazias por coluna:")
print(desafio2_normalizado.isna().sum())
No exemplo acima, o replace(r'^\s*$', np.nan, regex=True)
foi usado para converter strings vazias ou com espaços em NaN
. E depois é usado isna().sum()
para mostrar a quantidade de valores vazios (NaN
) por coluna.
Conteúdos relacionados para estudar
As páginas estão em inglês, se prefere ler em português, recomendo usar o tradutor automático do navegador.
Conte sempre com a nossa ajuda aqui no fórum, Ádria.
Até mais!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado!