Qual o desvio médio absoluto, a variância e desvio padrão da renda das pessoas responsáveis na pesquisa?
estatisticas_dados = dados['Renda'].agg(
mad = lambda elemento: (abs(elemento - elemento.mean())).mean(),
variancia = 'var',
desvio_padrao = 'std'
)
round(estatisticas_dados, 2)
Construa uma tabela com a média, mediana e desvio padrão para a renda das pessoas em relação aos Anos de Estudo. O que podemos interpretar com esses dados?
estatisticas_anos_de_estudo = dados.groupby('anos_de_estudo_nome')['Renda'].agg(
media = 'mean',
mediana = 'median',
desvio_padrao = 'std'
)
estatisticas_anos_de_estudo
Construa uma tabela com a média, mediana e desvio padrão para a renda das pessoas do sexo biológico masculino e feminino até R$ 15.000. O que podemos interpretar com esses dados?
sexo_15000 = dados[dados['Renda'] <= 15000].groupby('sexo_nome')['Renda'].agg(
media = 'mean',
mediana = 'median',
desvio_padrao = 'std'
)
sexo_15000
Construa um boxplot da Renda dos estados da Região Centro-Oeste até R$ 10.000 segundo o Cat.Sexo.
centro_oeste = ['Goiás', 'Mato Grosso', 'Mato Grosso do Sul', 'Distrito Federal']
renda_centro_oeste = dados[(dados['Renda'] <= 10000) & (dados['UF'].isin(centro_oeste))]
sns.boxplot(data = renda_centro_oeste, x = 'Renda', y = 'sexo_nome')
plt.ylabel('Sexo');
estatisticas_renda = round(pd.crosstab(renda_centro_oeste['UF'], renda_centro_oeste['sexo_nome'], values = renda_centro_oeste['Renda'], aggfunc = ['mean', 'median', 'std']))
media_renda
plt.figure(figsize = (8, 5))
sns.boxplot(data = renda_centro_oeste, x = 'Renda', y = 'UF', hue = 'sexo_nome')
plt.legend(title="Sexo", bbox_to_anchor=(1.02, 0.2))