Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Transformação variável explicativa

Posso transformar os valores categóricos em apenas uma coluna com valores numéricos para mais de duas variáveis? Exemplo: na coluna estado civil existem 3 categorias casado, solteiro e divorciado. Posso atribuir valor 0 para solteiro, 1 para divorciado e 2 para casado em um modelo de machine learning?

1 resposta
solução!

Oii, Pedro! Tudo bem?

Esse tipo de abordagem que trouxe como exemplo é a Label enconding o que pode não ser viável por adicionar um viés no modelo, fazendo com o que ele interprete que uma categoria é maior ou menor que outra. Dá para usar o One hot enconding, onde cada categoria se transforma em uma coluna binária separada, indicando a presença ou ausência dessa categoria. Por exemplo, para a coluna "estado civil", você teria três novas colunas: "solteiro", "divorciado" e "casado", com valores 0 ou 1. Então o modelo não interpreta uma hierarquia entre os valores.

Espero ter ajudado, conte sempre conosco aqui no fórum.

Bons estudos e até mais!