Solucionado (ver solução)

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

Solucionado
(ver solução)
3
respostas

Contando valores 'nan' em um dataframe pandas

Imagine que temos um arquivo CSV chamado dados.csv:

col1    col2    col3    col4
1    2    3    4
5    6    7    8
9    10    11    12
13    14    15    
33    44
import numpy as np
import pandas as pd

po = pd.read_csv('/dados.csv')

Meu objetivo é entender melhor como identificar dados Nan/null em um dataset.

Perguntas:

Como contar quantos dados 'nan' existem no dataset acima?

Como contar quantos dados null existem no dataset acima?

Como contar quantos dados NÃO 'nan' existem no dataset acima?

Como contar quantos dados NÃO 'null' existem no dataset acima?

E as mesmas questões acima mas por coluna?

Eu tentei, por exemplo,:

po[po['col4'].isna()].count()

pensando em contas quantos 'nan' existem na coluna 4, mas a resposta foi:

col1    2
col2    2
col3    1
col4    0
dtype: int64
3 respostas

Edson,

import numpy as np
import pandas as pd
po = pd.read_csv('dados/dados.csv')
col1    col2    col3    col4
0    1    2    3.0    4.0
1    5    6    7.0    8.0
2    9    10    11.0    12.0
3    13    14    15.0    NaN
4    33    44    NaN    NaN

po[po['col4'].isna()].count()

col1    2
col2    2
col3    1
col4    0
dtype: int64

po.isnull().sum()

col1    0
col2    0
col3    1
col4    2
dtype: int64

len(po)

5

po.count()

col1    5
col2    5
col3    4
col4    3
dtype: int64

@Welton Vaz de Souza:

Obrigado!

po[po['col4'].isna()].count() : nao entendi!

solução!

Edson,

Soma os null