Além do método utilizado e do OneHotEncoder citado em outro comentário, também seria possível utilizar o pd.get_dummies também, não?
Além do método utilizado e do OneHotEncoder citado em outro comentário, também seria possível utilizar o pd.get_dummies também, não?
Olá Lucas, tudo bem? Espero que sim!
Desculpe pela demora em retornar.
Sim Lucas, também é possível utilizar o pd.get_dummies() para criação de colunas binárias para cada uma das categorias, assim como é feito no OneHotEncoder. O instrutor fez uma abordagem mais manual, mas muito importante para enfatizar o procedimento que deve ser realizado na transformação dos dados. Mas na prática, recorremos às bibliotecas para que o processo seja mais rápido.
O OneHotEncoder é mais robusto e indicado para utilizar em modelos que receberão novos dados a todo momento, uma vez que ao ser instanciado uma única vez, será capaz de direcionar novos elementos para as respectivas colunas.
O get_dummies por sua vez não se dará muito bem ao receber novos dados no conjunto de dados, sendo necessário rodar o método para todo o conjunto de dados anterior novamente em conjunto com os novos dados, pois criará as colunas com base nas categorias de uma coluna.
Espero que tenha tirado sua dúvida.
Estou à disposição. Bons estudos!