Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Sobre o groupby

Quando usamos o groupby em um dataframe, cada uma das colunas é dividida em grupo e tem seu índice gravado, é isso ?

2 respostas
solução!

E aí Márcio! Tudo tranquilo??

O groupby vai agrupar os dados para permitir que você execute operações para cada grupo criado. Esse método divide os dados com base na coluna e/ou condição desejada em grupos e aplica a função desejada nesse grupo, combinando o resultado em uma única saída.

Esse método pode envolver uma ou mais das seguintes etapas

  • Dividir os dados em grupos com base em alguns critérios;
  • Aplicar uma função a cada grupo de forma independente;
  • Combinar os resultados em uma estrutura de dados, geralmente em um DataFrame ou em uma Series.

Destes, a etapa de divisão é a mais direta. Na verdade, em muitas situações, podemos dividir o conjunto de dados em grupos e fazer algo com esses grupos. Na etapa de aplicação, podemos utilizar diferentes recursos:

  • Funções de agregação como soma (sum) ou contagem (count), funções estatísticas como média (mean) ou desvio padrão (std) e funções personalizadas.
  • Funções de transformação: executar alguns cálculos específicos do grupo e retornar uma “lista” de valores. Por exemplo, para preencher Nan's (valores nulos) dentro de um valor específico para cada grupo.
  • Funções de filtrar: selecionar alguns grupos específicos e descartar alguns grupos. Por exemplo, filtrar os outliers com base na soma ou média do grupo.

Nesse link você encontra um guia de usuário do pandas (em inglês) com vários exemplos detalhados utilizando o groupby e aplicando diferentes funções. E nesse artigo (também está em inglês) é apresentado outros exemplos utilizando essa função e também aplicando algumas funções de agregação.

Caso queira acessar a documentação do groupby, basta clicar aqui

Espero ter ajudado :)

Qualquer dúvida vai me falando aqui, tá bom?

Bons estudos!

Tendi, obrigado !