Oi, Luiz, tudo bem?
No código apresentado na aula, temos as seguintes classes de altura:
- '1 - Baixa': Essa classe inclui todas as alturas do valor mínimo até 1.65 (exclusivo). Ou seja, todas as alturas menores que 1.65 estão nessa classe.
- '2 - Média': Essa classe inclui todas as alturas de 1.65 (inclusivo) até 1.75 (exclusivo). Ou seja, todas as alturas que são maiores ou iguais a 1.65, mas menores que 1.75, estão nessa classe.
- '3 - Alta': Essa classe inclui todas as alturas de 1.75 (inclusivo) até o valor máximo. Ou seja, todas as alturas que são maiores ou iguais a 1.75 estão nessa classe.
Isso está conforme o que você descreveu. A função cut()
do pandas é usada para dividir dados contínuos em intervalos ou "bins". O parâmetro bins
define os limites desses intervalos e o parâmetro labels
define os rótulos para esses intervalos. O parâmetro include_lowest
é usado para incluir o valor mais baixo no primeiro intervalo.
Aqui está um exemplo prático de como a função cut()
funciona:
import pandas as pd
data = pd.DataFrame({'Altura': [1.62, 1.67, 1.73, 1.78, 1.82]})
classes = [data.Altura.min(), 1.65, 1.75, data.Altura.max()]
labels = ['1 - Baixa', '2 - Média', '3 - Alta']
data['Altura_Classe'] = pd.cut(
x = data.Altura,
bins = classes,
labels = labels,
include_lowest = True
)
print(data)
Espero ter ajudado. Caso tenha dúvidas, não hesite em postar no fórum!
Abraços!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!