2
respostas

[Dúvida] LabelEncoder

Qual o motivo de usar LabelEncoder nas variaveis X, se semanticamente errado usar em variáveis X?

2 respostas

Olá, William! Como vai?

Na solução dada pelo instrutor na atividade, o LabelEncoder é usado nas colunas binárias/duas categorias ('HeartDisease', 'Smoking', 'AlcoholDrinking', 'Stroke', 'DiffWalking', 'PhysicalActivity', 'Asthma', 'KidneyDisease', 'SkinCancer') porque ele é adequado para transformar dados categóricos em numéricos quando a ordem das categorias não importa.

Para as colunas com múltiplas categorias sem ordem natural ('Sex', 'AgeCategory', 'Race', 'Diabetic', 'GenHealth'), o OneHotEncoder é mais apropriado, pois cria colunas separadas para cada categoria, evitando que o modelo interprete uma ordem inexistente.

Por esse motivo o LabelEncoder foi apropriado nesse caso.

Espero ter ajudado e fico à disposição se precisar.

Abraço e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado

E o OrdinalEncoder também poderia ser usado?