Ainda não tem acesso? Estude com a gente! Matricule-se
Ainda não tem acesso? Estude com a gente! Matricule-se

Columns e columns.name

Ao criar um dataframe ele considera que ha apenas 1 coluna quando na verdade temos 2, e por isso ele so nomeia a sugunda coluna com "Tipos Dados".

tipos = pd.DataFrame(planilhas.dtypes, columns = ["Tipos Dados"])

Ao utilizarmos o segundo codigo, conseguimos nomear a primeira coluna

tipos.columns.name = "Variaveis"

Por acaso o formato dataframe considera que a primeira coluna é alguma especie de index e somente as demais colunas são consideradas "columns"?

1 resposta

Olá Ricardo,

Nesse exemplo estamos criando o DataFrame a partir de uma Series (planilhas.dtypes retorna uma Series) então o pandas percebeu que essa Series já tem um index e já utilizou esse index no DataFrame. Resumindo planilhas.dtypes não tem exatamente duas colunas, tem um index e uma coluna de valores.

No segundo código quando fazemos tipos.columns.name = "Variaveis" estamos colocando um nome para a coluna de index.

Os DataFrames seguem então essa estrutura, a primeira "coluna" é o index (algo como um ID ou um identificador) e o restante das colunas são os dados principais, você pode até considerar o index como não sendo uma coluna, como se fosse algo separado apenas para ordem/organização.

Por acaso o formato dataframe considera que a primeira coluna é alguma especie de index e somente as demais colunas são consideradas "columns"?

É como você falou, mas apenas depois de criar o DataFrame. Normalmente o próprio pandas cria o index utilizando números de 0 até o total de linhas, fora nos casos em que você já define um index.

É um pouco confuso, mas espero ter ajudado.