1
resposta

[Dúvida] Dúvida sobre o uso do OneHotEncoder

Oi, pessoal!

Tenho uma dúvida sobre o uso do OneHotEnconder. Na resolução do segundo desafio da aula dois, o código aplica o OneHotEncoder(drop='if_binary') para as colunas sexo_biologico, pais, tem_cartao_credito e membro_ativo. Entretanto, as colunas tem_cartao_credito e membro_ativo já estão no formato numérico binário (0 e 1).

Minha dúvida é, por que essas colunas estão passando pelo OneHotEnconder se já estão prontas pra uso em modelos de ML?

Seria errado não aplicar a transformação pra esses dois casos?

1 resposta

Opa!

Não sei se o pessoal vai concordar comigo mas no seu exemplo apresentado, não seria errado o fato de não aplicar a transformação nessas duas colunas (e, na verdade, o próprio OneHotEncoder já deve ignorá-las com o argumento drop='if_binary'). No entanto, garantir que você está aplicando a transformação apenas quando necessário é uma boa prática para evitar redundâncias ou manipulações desnecessárias dos dados.