Imagine que temos um arquivo CSV chamado dados.csv:
col1 col2 col3 col4
1 2 3 4
5 6 7 8
9 10 11 12
13 14 15
33 44
import numpy as np
import pandas as pd
po = pd.read_csv('/dados.csv')
Meu objetivo é entender melhor como identificar dados Nan/null em um dataset.
Perguntas:
Como contar quantos dados 'nan' existem no dataset acima?
Como contar quantos dados null existem no dataset acima?
Como contar quantos dados NÃO 'nan' existem no dataset acima?
Como contar quantos dados NÃO 'null' existem no dataset acima?
E as mesmas questões acima mas por coluna?
Eu tentei, por exemplo,:
po[po['col4'].isna()].count()
pensando em contas quantos 'nan' existem na coluna 4, mas a resposta foi:
col1 2
col2 2
col3 1
col4 0
dtype: int64