media = dados['Renda'].mean()
mediana = dados['Renda'].median()
moda = dados['Renda'].mode()
print(f'media: {media.round(1)} | mediana: {mediana} | moda: {moda}')
renda_estados_top_5 = dados.groupby('UF')['Renda'].mean().sort_values(ascending = False).reset_index()
renda_estados_top_5 = renda_estados_top_5.head()
plt.figure(figsize=(10, 6))
sns.barplot(data = renda_estados_top_5, x = 'UF', y = 'Renda', color = '#FF6347')
plt.title('TOP 5 - Estados Pela Média de Renda', fontsize = 16)
plt.xlabel('Estados', fontsize = 12)
plt.ylabel('Média de Renda (R$)', fontsize = 12)
for index, row in renda_estados_top_5.iterrows():
plt.text(index, row['Renda'] + 0.2, f" R$ {row['Renda']:.2f}",
ha='center', va='bottom', fontsize=12)
plt.show()
regiao_sudeste = ['Minas Gerais', 'Espírito Santo', 'Rio de Janeiro', 'São Paulo']
dados_sudeste = dados[dados['UF'].isin(regiao_sudeste)]
dados_sudeste
sudeste_sexo_media = pd.crosstab(dados_sudeste['Sexo_categoria'], dados_sudeste['UF'], values=dados_sudeste['Renda'], aggfunc='mean')
sudeste_sexo_media = round(sudeste_sexo_media, 2)
sudeste_sexo_media
sudeste_sexo_mediana = pd.crosstab(dados_sudeste['Sexo_categoria'], dados_sudeste['UF'], values=dados_sudeste['Renda'], aggfunc='median')
sudeste_sexo_mediana = round(sudeste_sexo_mediana, 2)
sudeste_sexo_mediana
sudeste_sexo_max = pd.crosstab(dados_sudeste['Sexo_categoria'], dados_sudeste['UF'], values=dados_sudeste['Renda'], aggfunc='max')
sudeste_sexo_max = round(sudeste_sexo_max, 2)
sudeste_sexo_max
sns.set_style("whitegrid")
sns.histplot(bins=30, data= dados, x='Altura', kde=True, kde_kws={'bw_adjust':2})
plt.title('Distribuição da altura', fontsize = 16)
plt.xlabel('Altura (m)', fontsize = 12)
plt.ylabel('Frequência', fontsize = 12)
plt.show()
sns.set_style("whitegrid")
sns.histplot(bins=30, data= dados, x='Idade', kde=True, kde_kws={'bw_adjust':2}, color = '#9ACD32')
plt.title('Distribuição da idade', fontsize = 16)
plt.xlabel('Idade (anos)', fontsize = 12)
plt.ylabel('Frequência', fontsize = 12)
plt.show()