Olá pessoal!
Estou fazendo a análise exploratória proposta na aula e repensando a solução apresentada pelo instrutor para a criação do gráfico com os 5 bairros de maior média de aluguel.
O código usado foi:
df.groupby('Bairro')[['Valor']].mean().sort_values('Valor')
df_bairros = df.groupby('Bairro')[['Valor']].mean().sort_values('Valor').head()
df_bairros.plot(kind='barh', figsize=(14,10), color='blue');
Achei que pode haver um problema ali: ao usar .sort_values('Valor')
sem especificar ascending=False
, o método ordena em ordem crescente por padrão. Assim, o .head()
pega os bairros com menor média de aluguel, e não os de maior valor, como pede o desafio.
Isso faria com que o gráfico também ficasse invertido — mostrando os bairros com aluguéis mais baixos como se fossem os mais altos.
Minha pergunta é: essa abordagem não estaria gerando um resultado contrário ao solicitado? E não seria melhor fazer algo assim?
df.groupby('Bairro')['Valor'].mean().sort_values(ascending=False).head()
Alguém mais percebeu isso ou testou outra abordagem?
Ou é algo relacionado a versão do Pandas?