Black November

ATÉ 50% OFF

TÁ ACABANDO!

0 dias

0 horas

0 min

0 seg

1
resposta

Criando a variável 'Classificação (Renda)'

Nessa aula achei interessante os dados sobre cada classe, então decidi criar uma nova coluna já que estava sendo usada como índice. Os passos abaixo mostram como cheguei ao resultado que queria.

Passo 1: Criar uma lista para representar as 17 classes e ser o novo índice.

labels = ['A', 'B', 'C', 'D', 'E', 'F',
          'G', 'H', 'I', 'J', 'K', 'L',
          'M', 'N', 'O', 'P', 'Q']

idx = pd.Index(labels)

Passo 2: Criar as variáveis 'Frequência' e 'Percentual'

frequencia = pd.value_counts(
    pd.cut(x= dados['Renda'],
           bins= 17,
           include_lowest= True),
    sort= False
)
percentual = pd.value_counts(
    pd.cut(x= dados['Renda'],
           bins= 17,
           include_lowest= True),
    sort= False,
    normalize= True).round(5) * 100

Passo 3: Estilizando o nosso dataframe:

dist_freq = pd.DataFrame({'Frequência' : frequencia, 'Percentual (%)' : percentual})
dist_freq.reset_index(inplace=True)
dist_freq.set_index(idx, inplace= True)
dist_freq.index.name = 'Classe'
dist_freq.rename(columns= {'index' : 'Classificação (Renda)'}, inplace= True)

dist_freq

O resultado foi esse: Distribuição de frequência

Matricule-se agora e aproveite até 50% OFF

O maior desconto do ano para você evoluir com a maior escola de tecnologia

QUERO APROVEITAR
1 resposta

Aberto para ideias e sugestões :P