1
resposta

[Projeto] Mão na massa: analisando a variação da renda das pessoas responsáveis

Qual o desvio médio absoluto, a variância e desvio padrão da renda das pessoas responsáveis na pesquisa?

estatisticas_dados = dados['Renda'].agg(
    mad = lambda elemento: (abs(elemento - elemento.mean())).mean(),
    variancia = 'var',
    desvio_padrao = 'std'
)

round(estatisticas_dados, 2)

Construa uma tabela com a média, mediana e desvio padrão para a renda das pessoas em relação aos Anos de Estudo. O que podemos interpretar com esses dados?

estatisticas_anos_de_estudo = dados.groupby('anos_de_estudo_nome')['Renda'].agg(
    media = 'mean',
    mediana = 'median',
    desvio_padrao = 'std'
)

estatisticas_anos_de_estudo

Construa uma tabela com a média, mediana e desvio padrão para a renda das pessoas do sexo biológico masculino e feminino até R$ 15.000. O que podemos interpretar com esses dados?

sexo_15000 = dados[dados['Renda'] <= 15000].groupby('sexo_nome')['Renda'].agg(
    media = 'mean',
    mediana = 'median',
    desvio_padrao = 'std'
)

sexo_15000

Construa um boxplot da Renda dos estados da Região Centro-Oeste até R$ 10.000 segundo o Cat.Sexo.

centro_oeste = ['Goiás', 'Mato Grosso', 'Mato Grosso do Sul', 'Distrito Federal']
renda_centro_oeste = dados[(dados['Renda'] <= 10000) & (dados['UF'].isin(centro_oeste))]

sns.boxplot(data = renda_centro_oeste, x = 'Renda', y = 'sexo_nome')
plt.ylabel('Sexo');

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

estatisticas_renda = round(pd.crosstab(renda_centro_oeste['UF'], renda_centro_oeste['sexo_nome'], values = renda_centro_oeste['Renda'], aggfunc = ['mean', 'median', 'std']))
media_renda

plt.figure(figsize = (8, 5))
sns.boxplot(data = renda_centro_oeste, x = 'Renda', y = 'UF', hue = 'sexo_nome')
plt.legend(title="Sexo", bbox_to_anchor=(1.02, 0.2))

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

1 resposta

Fala, Vinicius, tudo bem?

Parabéns por concluir mais essa atividade prática e por compartilhar o seu projeto aqui no fórum com a gente!

O seu código ficou excelente e super organizado. Você mandou muito bem na utilização dos métodos agg() e groupby() do Pandas para extrair as medidas de tendência central e dispersão de forma bem limpa e direta. Bons estudos!

Sucesso

Imagem da comunidade