Olá. Não entendi muito bem quando devemos usar o aggfunc e quais os parâmetros necessários para ela rodar. Alguém poderia me dar mais detalhes, por favor?
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Olá. Não entendi muito bem quando devemos usar o aggfunc e quais os parâmetros necessários para ela rodar. Alguém poderia me dar mais detalhes, por favor?
Olá, Vivian, tudo bem?
Desculpe a demora em te responder!
No método pd.crosstab() o parâmetro aggfunc é utilizado para realizar agregações de dados conforme uma determinada função dentro do cruzamento de variáveis. Supondo que devemos calcular a média da variável "Renda" para cada combinação de "Sexo" e "Cor" podemos utilizar o aggfunc com o valor mean (que calcula a média) e especificar a variável "Renda" por meio do parâmetro values. Ao utilizar o aggfuncdevemos especificar qual o tipo agregação deve ser aplicado, nesse caso a média (mean) e o tipo de valor que será calculado levando em conta os cruzamentos de dados da tabela, nesse caso o valor que queremos obter é a renda para pessoas de diferentes grupos étnicos e de gênero.
O exemplo mencionado acima em formato de código seria assim:
percentual = pd.crosstab(dados.Sexo,
dados.Cor,
aggfunc='mean',
values=dados.Renda)
Neste caso, o resultado será uma tabela que mostra a média da renda para cada combinação de sexo e cor. Isso nos permite realizar análises mais detalhadas do conjunto de dados, como verificar se existem diferenças significativas na renda média entre diferentes grupos étnicos e de gênero.
É importante ressaltar que o aggfunc pode receber outras funções, como sum para calcular a soma, max para o valor máximo, min para o valor mínimo, entre outras.
Espero ter ajudado. Caso tenha dúvidas, não hesite em postar no fórum.
Abraços!