3
respostas

Modo mais simples de selecionar as colunas

No minuto do 3:30 do vídeo onde quer fazer a selecao das colunas excluindo o "total_de_pessoas" se usa o seguinte código:

gorjetas.groupby(['dia_da_semana']).mean()[['valor_da_conta', 'gorjeta', 'porcentagem']]

Existe um meio alternativo de escrever sendo que eu apenas mencione a coluna "total_de_pessoas" para ser excluída? Pensando em um data frame maior, digamos com 20 colunas, e querendo excluir apenas 1, é muito texto para escrever todas as colunas no código.

Sei também que teria a opção de usar o drop() e armazenar o resultado em uma variável, mas gostaria de saber se existe outro método mais ágil.

3 respostas

Oii João, tudo bem?

Acredito que a opção drop() seja muito eficiente pra esses casos de remoção de coluna, só não podemos esquecer de 'salvar' essas modificações, dessa forma aqui:

gorjetas = gorjetas.drop(columns=['total_de_pessoas'])
gorjetas.head()

Precisamos fazer uma nova atribuição à variável que remete ao dataframe, com ele agora modificado sem a coluna que queremos retirar, já que apenas aplicar alguma operação no dataframe por si só não afetam em nada.

Caso queira saber mais, temos esse artigo que explica como remover linhas e colunas utilizando o Pandas.

Qualquer outra dúvida, estou por aqui, ok?

Bons estudos ^^

Olá Sthefanie, obrigado pela resposta!

Li o artigo e entendi o que estava querendo encontrar.

Usando o seguinte código consegui o mesmo output:

gorjetas.groupby(['dia_da_semana').mean().drop(columns='total_de_pessoas')

A ideia seria apenas visualizar os valores naquele momento, mas ao invés de ter que escrever todas colunas, apenas mostrar excluindo a que eu não queria.

Oii João! Como está por ai?

Que bom que consegui te ajudar de alguma forma ^^

Sempre que precisar, pode chamar!

Bons estudos ^^