1
estat_renda = dados['Renda'].agg(
media='mean',
mediana='median',
mad=lambda x: (abs(x - x.mean())).mean()
).reset_index()
# Exibindo o resultado
round(estat_renda,2)
2
estat_renda_anos_estudo = dados.groupby('Cat.Anos.de.Estudo', observed=False)['Renda'].agg(
media='mean',
mediana='median',
desvio_padrao='std'
).reset_index()
estat_renda_anos_estudo
3
estat_renda_sexo = dados[dados['Renda'] <= 15000].groupby('Cat.Sexo')['Renda'].agg(
media='mean',
mediana='median',
desvio_padrao='std'
).reset_index()
estat_renda_sexo
4
renda_10k_centro_oeste = dados[dados['UF'].isin(['Goiás', 'Distrito Federal', 'Mato Grosso', 'Mato Grosso do Sul', 'Tocantins']) & (dados['Renda'] <=10e3)]
dados_sudeste
# Criando o boxplot
plt.figure(figsize=(8, 6))
ax = sns.boxplot(x='Renda', y='UF', data=renda_10k_centro_oeste, hue='Cat.Sexo')
# Adicionando título e rótulos aos eixos
plt.title('Distribuição de Renda no Centro-Oeste por unidade federativa e sexo')
plt.xlabel('Renda (R$)')
plt.ylabel('UF')
# Exibindo o gráfico
plt.show()
renda_10k_centro_oeste_media = round(pd.crosstab(renda_10k_centro_oeste['Cat.Sexo'], renda_10k_centro_oeste['UF'], values=renda_10k_centro_oeste['Renda'], aggfunc='mean'), 2)
renda_10k_centro_oeste_media
renda_10k_centro_oeste_mediana = round(pd.crosstab(renda_10k_centro_oeste['Cat.Sexo'], renda_10k_centro_oeste['UF'], values=renda_10k_centro_oeste['Renda'], aggfunc='median'), 2)
renda_10k_centro_oeste_mediana
renda_10k_centro_oeste_sd = round(pd.crosstab(renda_10k_centro_oeste['Cat.Sexo'], renda_10k_centro_oeste['UF'], values=renda_10k_centro_oeste['Renda'], aggfunc='std'), 2)
renda_10k_centro_oeste_sd