Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Dúvida] Difereça entre OneHotEnconder, LabelEnconder e Transformação Manual ou GetDummies

No vídeo o professor utiliza dois métodos da biblioteca Scikit-Learn para fazer a transformação das variáveis categóricas (X) e variável target (y). Entretanto, entendo que a mesma transformação poderia ser obtida através da função get_dummies do pandas para as variáveis categóricas (X) e uma simples transformação binária (0 e 1 ou True e False) para a variável target (y). Qual a diferença entre esses métodos utilizados e os que eu mencionei?

1 resposta
solução!

Olá! Tudo bem?

Há várias maneiras de converter variáveis categóricas em numéricas para preparar dados para algoritmos de machine learning. Primeiro, irei explicar a funcionalidade delas:

  1. OneHotEncoder (Scikit-Learn): Este método cria uma nova coluna binária para cada categoria da variável. Por exemplo, se tivermos uma variável categórica 'cor' com 'vermelho', 'verde' e 'azul', o OneHotEncoder criará três novas colunas, uma para cada cor.

  2. LabelEncoder (Scikit-Learn): Este método atribui um número a cada categoria da variável categórica. Por exemplo, 'vermelho' pode ser codificado como 1, 'verde' como 2 e 'azul' como 3. É útil quando há uma ordem natural nas categorias.

  3. get_dummies (Pandas): Similar ao OneHotEncoder, cria novas colunas binárias, mas pode ser aplicado diretamente a um DataFrame do Pandas, sendo mais conveniente.

  4. Transformação binária manual: Simplesmente atribui 1 ou 0 para representar as categorias. Por exemplo, 'masculino' pode ser 1 e 'feminino' pode ser 0.

A escolha entre elas dependerá de alguns fatores, como o número de categorias, da preservação da ordem, da facilidade de uso e integração, e da capacidade de lidar com novas categorias. Por exemplo, para conjuntos de dados menores ou para quem prefere trabalhar exclusivamente com DataFrames do Pandas, a escolha do get_dummies é mais conveniente. Portanto, dependerá do contexto dos dados.

Espero ter esclarecido.

Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!