1
resposta

Mão na massa: : analisando a renda das pessoas responsáveis

media = dados['Renda'].mean()
mediana = dados['Renda'].median()
moda = dados['Renda'].mode()
print(f'media: {media.round(1)} | mediana: {mediana} | moda: {moda}')

renda_estados_top_5 = dados.groupby('UF')['Renda'].mean().sort_values(ascending = False).reset_index()
renda_estados_top_5 = renda_estados_top_5.head()

plt.figure(figsize=(10, 6))
sns.barplot(data = renda_estados_top_5, x = 'UF', y = 'Renda',  color = '#FF6347')

plt.title('TOP 5 - Estados Pela Média de Renda', fontsize = 16)
plt.xlabel('Estados', fontsize = 12)
plt.ylabel('Média de Renda (R$)', fontsize = 12)

for index, row in renda_estados_top_5.iterrows():
    plt.text(index, row['Renda'] + 0.2, f" R$ {row['Renda']:.2f}",
             ha='center', va='bottom', fontsize=12)


plt.show()

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

regiao_sudeste = ['Minas Gerais', 'Espírito Santo', 'Rio de Janeiro', 'São Paulo']
dados_sudeste = dados[dados['UF'].isin(regiao_sudeste)]
dados_sudeste

sudeste_sexo_media = pd.crosstab(dados_sudeste['Sexo_categoria'], dados_sudeste['UF'], values=dados_sudeste['Renda'], aggfunc='mean')
sudeste_sexo_media = round(sudeste_sexo_media, 2)
sudeste_sexo_media

sudeste_sexo_mediana = pd.crosstab(dados_sudeste['Sexo_categoria'], dados_sudeste['UF'], values=dados_sudeste['Renda'], aggfunc='median')
sudeste_sexo_mediana = round(sudeste_sexo_mediana, 2)
sudeste_sexo_mediana

sudeste_sexo_max = pd.crosstab(dados_sudeste['Sexo_categoria'], dados_sudeste['UF'], values=dados_sudeste['Renda'], aggfunc='max')
sudeste_sexo_max = round(sudeste_sexo_max, 2)
sudeste_sexo_max
sns.set_style("whitegrid")
sns.histplot(bins=30, data= dados, x='Altura', kde=True, kde_kws={'bw_adjust':2})
plt.title('Distribuição da altura', fontsize = 16)
plt.xlabel('Altura (m)', fontsize = 12)
plt.ylabel('Frequência', fontsize = 12)
plt.show()

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

sns.set_style("whitegrid")
sns.histplot(bins=30, data= dados, x='Idade', kde=True, kde_kws={'bw_adjust':2}, color = '#9ACD32')
plt.title('Distribuição da idade', fontsize = 16)
plt.xlabel('Idade (anos)', fontsize = 12)
plt.ylabel('Frequência', fontsize = 12)
plt.show()

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

1 resposta

Olá, Márcia! Como vai?

Muito bem! Seus gráficos ficaram ótimos.

Observei que você explorou o uso de estatísticas descritivas para sintetizar informações relevantes sobre a renda, utilizou muito bem o agrupamento com groupby para comparar médias entre estados e ainda compreendeu a importância das visualizações com seaborn e matplotlib para comunicar os dados de forma clara.

Uma dica interessante para o futuro é usar seaborn.color_palette() para personalizar ainda mais os gráficos. Dessa forma:

cores = sns.color_palette("viridis", 5)
sns.barplot(data=renda_estados_top_5, x='UF', y='Renda', palette=cores)

Resultado: Gráfico com cores gradientes que geram mais destaque.

Isso faz com que a visualização atrativa e facilite a interpretação dos dados.

Ícone de sugestão Para saber mais:

Sugestão de conteúdo para você mergulhar ainda mais sobre o tema:

Alguns materiais estão em inglês, mas é possível compreendê-los usando o recurso de tradução de páginas do próprio navegador.

Fico à disposição! E se precisar, conte sempre com o apoio do fórum.

Abraço e bons estudos!

AluraConte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!