[Dúvida] quantas features posso escolher para resolver um problema de machine learning de classificação ou regressão?

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

por Ricardo Dib

| 3234.4k xp | 7 posts

quantas features de um dataset posso escolher para resolver um caso de machine learning de classificação ou regressão?

1 resposta

por Bruno Raphaell

| 366.6k xp | 449 posts

07/11/2022

Olá, Ricardo! Tudo bem com você?

Vai depender muito do conjunto de dados que você estiver trabalhando. Por exemplo, se você tem um conjunto de dados que possui um ID para cada amostra, não é recomendável você mantê-la em seu conjunto de dados. O mesmo vale para, por exemplo, nome de pessoa caso seja único para cada amostra, é aconselhável você não manter.

Outro caso é caso a sua feature possua uma grande quantidade de valores nulos, ao imputar dados pode acontecer de você inserir um viés, então em algumas situações é mais aconselhável retirar essa feature.

Então sempre vai depender de como está seu conjunto de dados. Você deve permanecer com as features que tenham dados de qualidade, quanto mais dados de qualidade você inserir para seu modelo se ajustar, melhores resultados você obterá.

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP