Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Pandas - dropna

Oi pessoal,

Qual a diferença ao utilizar 'subset' no método dropna? Estudando Python, me deparei com esta forma e consultando a documentação, nao ficou muito claro pra mim.

df.dropna(subset=["price"], axis=0)

Quando utilizei a forma abaixo, também deu certo. Por isso, gostaria de entender a diferença

df['price'].dropna()

Muito obrigada!!

2 respostas
solução!

Olá Daiane,

A diferença é que quando você usa o subset, você está especificando a coluna para a qual serão eliminadas as linhas com nulos.

Por exemplo:

import pandas as pd
import numpy as np

df = pd.DataFrame({"name": ['Alfred', 'Batman', 'Catwoman'],
                   "toy": [np.nan, 'Batmobile', 'Bullwhip'],
                   "born": [pd.NaT, pd.Timestamp("1940-04-25"),   pd.NaT]})

# print do df
In[ ]: df
Out[]: 
        born      name        toy
0        NaT    Alfred        NaN
1 1940-04-25    Batman  Batmobile
2        NaT  Catwoman   Bullwhip

# Eliminando qualquer linha cuja coluna tenha nulos
In[ ]: df.dropna()
Out[]: 
        born    name        toy
1 1940-04-25  Batman  Batmobile

# Eliminando as linhas que estão nulas apenas na coluna 'toy'
In[ ]: df.dropna(subset=['toy'])
Out[]: 
        born      name        toy
1 1940-04-25    Batman  Batmobile
2        NaT  Catwoman   Bullwhip

Abs

@Fabio,

Muito obrigada!!