Olá, Italo, tudo bem?
Quando você utiliza df_vendas_ano.groupby('Ano')['vendas'].sum()
, você está aplicando diretamente a função de soma sobre o agrupamento. Isso é simples e direto quando você só precisa de uma operação de agregação, como a soma.
Já o método .aggregate()
(ou .agg()
) é mais flexível e poderoso, permitindo que você aplique múltiplas funções de agregação ao mesmo tempo ou mesmo funções personalizadas. Por exemplo, se você quisesse calcular tanto a soma quanto a média das vendas por ano, você poderia fazer algo assim:
df_vendas_ano = df_vendas_ano.groupby('Ano')['vendas'].aggregate(['sum', 'mean'])
Isso criaria um DataFrame com duas colunas, uma para a soma e outra para a média das vendas por ano. Essa flexibilidade é a principal vantagem de usar .aggregate()
.
Espero ter esclarecido.
Qualquer dúvida, não hesite em compartilhar no fórum.
Abraços!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado