1
resposta

One-Hot Enconding vs Label Enconding

Vendo a aula eu entendi que foi adotado o One-Hot para evitar enviesar os dados que serão usados. O que gostaria de saber é quando devo utilizar o label enconding, quando é o caso específico para seu uso?

Alguém poderia me auxiliar e esclarecer?

1 resposta

Olá, Daniel! Tudo tranquilo por aí?

O Label Encoder é indicado quando a tua feature categórica é ordenada.

Vamos supor que você está trabalhando com alguma base de dados onde uma das features possui os valores "ruim", "médio", "bom" e "excelente", então nessa feature não haveria problema em utilizar o Label Encoder, pois os algoritmos de machine learning assumem que dois valores próximos são mais semelhantes que dois valores distantes, e essa relação é respeitada em features com valores ordenados como a do exemplo acima.

Como no curso a variável é o tipo de pagamento, realizar o Label Encoder faria os algoritmos de machine learning assumir que CASH_IN é semelhante TRANSFER, por exemplo, o que enviesaria o modelo. Nesses casos é indicado o One-hot Encoder.

Espero ter ajudado, mas se ainda persistir alguma dúvida estou sempre à disposição.

:)

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!