Solucionado (ver solução)
Solucionado
(ver solução)
3
respostas

Contando valores 'nan' em um dataframe pandas

Imagine que temos um arquivo CSV chamado dados.csv:

col1    col2    col3    col4
1    2    3    4
5    6    7    8
9    10    11    12
13    14    15    
33    44
import numpy as np
import pandas as pd

po = pd.read_csv('/dados.csv')

Meu objetivo é entender melhor como identificar dados Nan/null em um dataset.

Perguntas:

Como contar quantos dados 'nan' existem no dataset acima?

Como contar quantos dados null existem no dataset acima?

Como contar quantos dados NÃO 'nan' existem no dataset acima?

Como contar quantos dados NÃO 'null' existem no dataset acima?

E as mesmas questões acima mas por coluna?

Eu tentei, por exemplo,:

po[po['col4'].isna()].count()

pensando em contas quantos 'nan' existem na coluna 4, mas a resposta foi:

col1    2
col2    2
col3    1
col4    0
dtype: int64
3 respostas

Edson,

import numpy as np
import pandas as pd
po = pd.read_csv('dados/dados.csv')
col1    col2    col3    col4
0    1    2    3.0    4.0
1    5    6    7.0    8.0
2    9    10    11.0    12.0
3    13    14    15.0    NaN
4    33    44    NaN    NaN

po[po['col4'].isna()].count()

col1    2
col2    2
col3    1
col4    0
dtype: int64

po.isnull().sum()

col1    0
col2    0
col3    1
col4    2
dtype: int64

len(po)

5

po.count()

col1    5
col2    5
col3    4
col4    3
dtype: int64

@Welton Vaz de Souza:

Obrigado!

po[po['col4'].isna()].count() : nao entendi!

solução!

Edson,

Soma os null