A coluna target deveria estar na lista colunas_categoricas?
A coluna target deveria estar na lista colunas_categoricas?
Oi, Kaio, tudo bem?
A lista colunas_categoricas
é utilizada para identificar quais colunas do seu DataFrame possuem dados categóricos (não numéricos) que precisam ser transformados usando o OneHotEncoder
. Essa transformação é necessária porque os modelos de machine learning geralmente trabalham melhor com dados numéricos. Então, o OneHotEncoder
converte cada valor categórico em uma série de colunas binárias (0 ou 1)
Mas, a inclusão da coluna target na lista colunas_categoricas
depende do que você pretende fazer. Normalmente, a coluna target não é incluída nas transformações de pré-processamento que são aplicadas às features (como one-hot encoding), pois ela é a variável que você está tentando prever, e não uma feature de entrada.
A coluna alvo deve ficar separada das colunas categóricas que passam pelo OneHotEncoder
. Dessa forma, o modelo de machine learning poderá focar em aprender a prever corretamente a variável alvo, utilizando as informações das outras colunas que foram transformadas.
Espero ter esclarecido.
Qualquer dúvida, não hesite em compartilhar no fórum.
Abraços!