1
resposta

Dummies

Além do método utilizado e do OneHotEncoder citado em outro comentário, também seria possível utilizar o pd.get_dummies também, não?

1 resposta

Olá Lucas, tudo bem? Espero que sim!

Desculpe pela demora em retornar.

Sim Lucas, também é possível utilizar o pd.get_dummies() para criação de colunas binárias para cada uma das categorias, assim como é feito no OneHotEncoder. O instrutor fez uma abordagem mais manual, mas muito importante para enfatizar o procedimento que deve ser realizado na transformação dos dados. Mas na prática, recorremos às bibliotecas para que o processo seja mais rápido.

O OneHotEncoder é mais robusto e indicado para utilizar em modelos que receberão novos dados a todo momento, uma vez que ao ser instanciado uma única vez, será capaz de direcionar novos elementos para as respectivas colunas.

O get_dummies por sua vez não se dará muito bem ao receber novos dados no conjunto de dados, sendo necessário rodar o método para todo o conjunto de dados anterior novamente em conjunto com os novos dados, pois criará as colunas com base nas categorias de uma coluna.

Espero que tenha tirado sua dúvida.

Estou à disposição. Bons estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software