1
resposta

[Dúvida] Dúvida sobre a coluna target

A coluna target deveria estar na lista colunas_categoricas?

1 resposta

Oi, Kaio, tudo bem?

A lista colunas_categoricas é utilizada para identificar quais colunas do seu DataFrame possuem dados categóricos (não numéricos) que precisam ser transformados usando o OneHotEncoder. Essa transformação é necessária porque os modelos de machine learning geralmente trabalham melhor com dados numéricos. Então, o OneHotEncoder converte cada valor categórico em uma série de colunas binárias (0 ou 1)

Mas, a inclusão da coluna target na lista colunas_categoricas depende do que você pretende fazer. Normalmente, a coluna target não é incluída nas transformações de pré-processamento que são aplicadas às features (como one-hot encoding), pois ela é a variável que você está tentando prever, e não uma feature de entrada.

A coluna alvo deve ficar separada das colunas categóricas que passam pelo OneHotEncoder. Dessa forma, o modelo de machine learning poderá focar em aprender a prever corretamente a variável alvo, utilizando as informações das outras colunas que foram transformadas.

Espero ter esclarecido.

Qualquer dúvida, não hesite em compartilhar no fórum.

Abraços!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado