Olá Luiz e Gustavo,
A resposta do Gustavo já explica o código completo, só complementando mais a fundo sobre o groupby
, ele vai agrupar os dados para permitir que você execute operações para cada grupo criado. Por exemplo executando: dados['Valor'].mean()
o resultado vai ser a média geral de todos os imóveis, agora agrupando por bairro e então aplicando a média: dados.groupby('Bairro')['Valor'].mean()
o resultado vai ser as médias do valor para cada bairro. Com esse código simples o pandas já divide todos os imóveis baseado no bairro e calcula a média para cada bairro separadamente.
Resumindo o groupby
é uma grande ajuda para agrupamento de dados com a intenção de aplicar uma função para cada grupo. No exemplo foi usado a média, mas existe muitas outras funções que podem ser aplicadas.
Nesse link (em inglês) tem um guia mostrando várias possibilidades do uso do groupby
com exemplos.
Sobre o tipo retornado pelo groupby
, é um tipo diferente porque o resultado não é apenas um DataFrame, o resultado é um DataFrame modificado chamado de DataFrameGroupBy
. Uma comparação válida é olhar os tipos str e int do python, cada um serve para representar um tipo diferente de dado.