dados.info()
dados.head()
dados['UF']
dados['UF'].unique()
dados['UF'].unique()
registros_uf = dados['UF'].value_counts().reset_index()
registros_uf
sns.barplot(data=registros_uf, x='count', y='UF', color='pink')
plt.show()
dados['Cat.Sexo'] = pd.Categorical(
dados['Sexo'],
categories=[0,1],
ordered=True
)
dados['Cat.Sexo'] = dados['Cat.Sexo'].map(sexo)
dados.head()
dados_distintos = dados[['Sexo', 'Cat.Sexo']].drop_duplicates()
dados_distintos
dados['Cat.Anos.de.Estudo'] = pd.Categorical(
dados['Anos.de.Estudo'],
categories=range(1, 18),
ordered=True
)
dados['Cat.Anos.de.Estudo'] = dados['Cat.Anos.de.Estudo'].map(anos_de_estudo)
dados.head()
dados_distintos = dados[['Anos.de.Estudo', 'Cat.Anos.de.Estudo']].drop_duplicates().sort_values(by='Cat.Anos.de.Estudo')
dados_distintos
print(f"A menor Renda da base de dados é de R${min(dados['Renda']):,.2f} e a maior é de R$ {max(dados['Renda']):,.0f}")
print(f"A menor Renda da base de dados é de R${min(dados['Renda']):,.2f} e a maior é de R$ {max(dados['Renda']):,.0f}")
# Contando as frequências de cada UF
frequencias = dados['UF'].value_counts().reset_index()
frequencias.columns = ['UF', 'Frequência']
frequencias