Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Tipo de dado Y_df

É correto afirmar que quando é recuperada apenas uma coluna do dataframe e não uma série, o retorno é uma série ao invés de um dataframe?

Ao executar:

import pandas as pd

df = pd.read_csv('Extras/busca.csv')

X_df = df[ ['home', 'busca', 'logado'] ]

Y_df = df[ 'comprou']

print( "type( X_df): ", type( X_df))

print( "type( Y_df): ", type( Y_df))

Obtenho como retorno:

type( X_df): <class 'pandas.core.frame.DataFrame'>

type( Y_df): <class 'pandas.core.series.Series'>

2 respostas
solução!

Oii Vicente! Como você está?

Peço desculpas pela demora em dar um retorno.

Mas podemos dizer que sua afirmação está correta sim :)

A Series é basicamente uma lista de valores com seus respectivos índices. Então quando realizamos a seleção de apenas uma coluna de um dataframe, conforme você fez no exemplo que apresentou aqui, é isso que temos: uma lista de valores sendo apresentadas com seus índices. O dataframe por sua vez, é uma tabela formada por várias colunas. Sendo assim, podemos dizer que o dataframe é um conjunto de Series.

Vamos fazer um pequeno exemplo para visualizarmos isso. Suponhamos que tenhamos as seguintes listas:

# listas utilizadas para criar as Series
nomes = ['Ana', 'João', 'Maria', 'Pedro']
idades = [12, 14, 11, 17]

Agora, vamos transformar essas listas em Series:

# Series 1
nomes = pd.Series(nomes)
nomes

# Resultado
0      Ana
1     João
2    Maria
3    Pedro
dtype: object
# Series 2
idades = pd.Series(idades)
idades

# Resultado
0    12
1    14
2    11
3    17
dtype: int64

Podemos confirmar então que as Series são apenas uma lista de valores, com índices.

Se quisermos juntar essas duas Series em uma única tabela, podemos criar um dataframe:

pd.DataFrame(data = {'Nomes': nomes, 'Idades': idades})

Resultado:

NomesIdades
0Ana12
1João14
2Maria11
3Pedro17

Assim, confirmamos que um dataframe pode ser considerado um conjunto de Series :)

Espero que tenha ajudado. Qualquer dúvida é só chamar.

Bons estudos!

Muito claro. Grato pelo retorno!