[Desafio] Pesquisa Nacional por Amostra de Domicílios – PNAD 2015 (IBGE) | Estatística com Python: resumindo e analisando dados

2
respostas

Referente ao curso Estatística com Python: resumindo e analisando dados

por THAMIRIS MORAIS FERREIRA ROCHA

| 64.1k xp | 140 posts

dados.info()

dados.head()

dados['UF']

dados['UF'].unique()

dados['UF'].unique()

registros_uf = dados['UF'].value_counts().reset_index()
registros_uf

sns.barplot(data=registros_uf, x='count', y='UF', color='pink')
plt.show()

dados['Cat.Sexo'] = pd.Categorical(
    dados['Sexo'],
    categories=[0,1],
   ordered=True
  )

dados['Cat.Sexo']  = dados['Cat.Sexo'].map(sexo)
dados.head()

dados_distintos = dados[['Sexo', 'Cat.Sexo']].drop_duplicates()
dados_distintos

dados['Cat.Anos.de.Estudo'] = pd.Categorical(
    dados['Anos.de.Estudo'],
    categories=range(1, 18),
   ordered=True
  )

dados['Cat.Anos.de.Estudo'] = dados['Cat.Anos.de.Estudo'].map(anos_de_estudo)
dados.head()

dados_distintos = dados[['Anos.de.Estudo', 'Cat.Anos.de.Estudo']].drop_duplicates().sort_values(by='Cat.Anos.de.Estudo')
dados_distintos

print(f"A menor Renda da base de dados é de R${min(dados['Renda']):,.2f} e a maior é de R$ {max(dados['Renda']):,.0f}")

print(f"A menor Renda da base de dados é de R${min(dados['Renda']):,.2f} e a maior é de R$ {max(dados['Renda']):,.0f}")

# Contando as frequências de cada UF
frequencias = dados['UF'].value_counts().reset_index()
frequencias.columns = ['UF', 'Frequência']
frequencias

2 respostas

por Daniel Nogueira

| 1799.5k xp | 3976 posts

Alura Scuba Team Analista de Suporte Educacional

24/07/2025

Olá, Thamiris! Como vai?

Muito bem! Continue resolvendo os desafios e compartilhando com a comunidade Alura.

Observei que você explorou o uso de value_counts() com reset_index() para analisar frequências por UF, utilizou muito bem o pd.Categorical para tratar variáveis categóricas e ainda compreendeu a importância do map() para atribuir significados mais legíveis aos dados brutos.

Permaneça postando as suas soluções, com certeza isso ajudará outros estudantes e tem grande relevância para o fórum.

Para saber mais:

Sugestão de conteúdo para você mergulhar ainda mais sobre o tema:

[Documentação] - pandas.DataFrame.value_counts

Alguns materiais estão em inglês, mas é possível compreendê-los usando o recurso de tradução de páginas do próprio navegador.

Fico à disposição! E se precisar, conte sempre com o apoio do fórum.

Abraço e bons estudos!

Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!

por THAMIRIS MORAIS FERREIRA ROCHA

| 64.1k xp | 140 posts

24/07/2025

# Contando as frequências de cada UF
frequencias = dados['UF'].value_counts().reset_index()
frequencias.columns = ['UF', 'Frequência']
frequencias

Tópicos relacionados

Conteúdos Alura com o tema