1
resposta

Distribuições de frequência com variáveis quantitativas

Teve uma pergunta aqui no fórum que me gerou duvidas e gostaria que me explicasse melhor. A pergunta foi feita pelo Andre com nome de Classes x Labels.

Na meu intendimento a divisão seria da seguinte forma:

Altura.min() até 1.65 (incluindo o valor mínimo devido a include_lowest=True mas excluindo 1.65) - label '1 - Baixa'. De 1.65 até 1.75 (incluindo 1.65 mas excluindo 1.75) - label '2 - Média'. De 1.75 até dados.Altura.max() (incluindo 1.75 mas também incluindo o valor máximo) - label '3 - Alta'.

1 resposta

Oi, Luiz, tudo bem?

No código apresentado na aula, temos as seguintes classes de altura:

  • '1 - Baixa': Essa classe inclui todas as alturas do valor mínimo até 1.65 (exclusivo). Ou seja, todas as alturas menores que 1.65 estão nessa classe.
  • '2 - Média': Essa classe inclui todas as alturas de 1.65 (inclusivo) até 1.75 (exclusivo). Ou seja, todas as alturas que são maiores ou iguais a 1.65, mas menores que 1.75, estão nessa classe.
  • '3 - Alta': Essa classe inclui todas as alturas de 1.75 (inclusivo) até o valor máximo. Ou seja, todas as alturas que são maiores ou iguais a 1.75 estão nessa classe.

Isso está conforme o que você descreveu. A função cut() do pandas é usada para dividir dados contínuos em intervalos ou "bins". O parâmetro bins define os limites desses intervalos e o parâmetro labels define os rótulos para esses intervalos. O parâmetro include_lowest é usado para incluir o valor mais baixo no primeiro intervalo.

Aqui está um exemplo prático de como a função cut() funciona:

import pandas as pd

data = pd.DataFrame({'Altura': [1.62, 1.67, 1.73, 1.78, 1.82]})
classes = [data.Altura.min(), 1.65, 1.75, data.Altura.max()]
labels = ['1 - Baixa', '2 - Média', '3 - Alta']

data['Altura_Classe'] = pd.cut(
    x = data.Altura,
    bins = classes,
    labels = labels,
    include_lowest = True
)

print(data)

Espero ter ajudado. Caso tenha dúvidas, não hesite em postar no fórum!

Abraços!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!