1
resposta

Modelo de regressão: features categóricas e numéricas

Olá pessoal! Estou estudando uma problema de modelagem cujo o banco de dados tem várias features categóricas de alta cardinalidade (s/ nenhuma clusterização simples) e que são importantes para o entendimento do negócio, e outras features que são numéricas. Quais modelos de regressão vcs sugerem para trabalhar com esse problema? Um modelo capaz de lidar bem com features categóricas e numéricas? Obrigado!

1 resposta

E aí, Anderson. Beleza?

Acho que não vou poder dar uma resposta muito direta pra você, mas recomendo dar uma olhada nesse post de um usuário do Kaggle com um passo a passo de um problema de regressão que tem um conjunto grande de variáveis categóricas.

https://www.kaggle.com/hemingwei/top-2-from-laurenstc-on-house-price-prediction

Passa pela normalização das variáveis e trata de abordagens puras e mescla de algoritmos de regressão.