1
resposta

Duvida em histograma e classes

Boa noite,

Na vídeo aula foi executado o seguinte comando:

frequencia= pd.value_counts(
    pd.cut(
        x= dados.Renda,
        bins= 17,
        include_lowest= True
    ),
    sort=False
)

Nesse caso, o numero de classes é 17 (bins).

Caso eu queira representar isso ai em um histograma, fazendo:

dados.Renda.hist(bins=17)

As classes serão as mesmas?

Aguardo atenciosamente!

1 resposta

Olá Flávia, Tudo bem ? Espero que sim.

Desculpa pela demora em uma resposta.

As classes serão quase as mesma, exceto pelo primeiro valor do intervalo da primeira classe.

Usando cut teremos:

(-200.001, 11764.706]

Enquanto que no hist teremos:

[     0.        ,  11764.70588235 ]

Podemos verificar isso de duas maneiras, olhando a documentação do matplotlib, já que o hist do Pandas chama a função hist dessa biblioteca (podemos ver na documentação do Pandas) e comparando com a do cut.

Ou podemos acessar os intervalos criados pelo hist:

import matplotlib.pyplot as plt
lista = plt.hist(x=dados.Renda, bins=17)[1]
lista

Teremos como resultado:

array([     0.        ,  11764.70588235,  23529.41176471,  35294.11764706,
        47058.82352941,  58823.52941176,  70588.23529412,  82352.94117647,
        94117.64705882, 105882.35294118, 117647.05882353, 129411.76470588,
       141176.47058824, 152941.17647059, 164705.88235294, 176470.58823529,
       188235.29411765, 200000.        ])

Com isso podemos comparar com os intervalos criados no cut:

dist_freq_quantitativas_amplitude_fixa.index

Teremos esse resultado:

CategoricalIndex([   (-200.001, 11764.706],   (11764.706, 23529.412],
                    (23529.412, 35294.118],   (35294.118, 47058.824],
                    (47058.824, 58823.529],   (58823.529, 70588.235],
                    (70588.235, 82352.941],   (82352.941, 94117.647],
                   (94117.647, 105882.353], (105882.353, 117647.059],
                  (117647.059, 129411.765], (129411.765, 141176.471],
                  (141176.471, 152941.176], (152941.176, 164705.882],
                  (164705.882, 176470.588], (176470.588, 188235.294],
                    (188235.294, 200000.0]],

Assim podemos ver que os intervalos se repetem.

Espero ter ajudado, bons estudos.

( :