Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

Criando a variável 'Classificação (Renda)'

Nessa aula achei interessante os dados sobre cada classe, então decidi criar uma nova coluna já que estava sendo usada como índice. Os passos abaixo mostram como cheguei ao resultado que queria.

Passo 1: Criar uma lista para representar as 17 classes e ser o novo índice.

labels = ['A', 'B', 'C', 'D', 'E', 'F',
          'G', 'H', 'I', 'J', 'K', 'L',
          'M', 'N', 'O', 'P', 'Q']

idx = pd.Index(labels)

Passo 2: Criar as variáveis 'Frequência' e 'Percentual'

frequencia = pd.value_counts(
    pd.cut(x= dados['Renda'],
           bins= 17,
           include_lowest= True),
    sort= False
)
percentual = pd.value_counts(
    pd.cut(x= dados['Renda'],
           bins= 17,
           include_lowest= True),
    sort= False,
    normalize= True).round(5) * 100

Passo 3: Estilizando o nosso dataframe:

dist_freq = pd.DataFrame({'Frequência' : frequencia, 'Percentual (%)' : percentual})
dist_freq.reset_index(inplace=True)
dist_freq.set_index(idx, inplace= True)
dist_freq.index.name = 'Classe'
dist_freq.rename(columns= {'index' : 'Classificação (Renda)'}, inplace= True)

dist_freq

O resultado foi esse: Distribuição de frequência

1 resposta

Aberto para ideias e sugestões :P