1
resposta

[Dúvida] quantas features posso escolher para resolver um problema de machine learning de classificação ou regressão?

quantas features de um dataset posso escolher para resolver um caso de machine learning de classificação ou regressão?

1 resposta

Olá, Ricardo! Tudo bem com você?

Vai depender muito do conjunto de dados que você estiver trabalhando. Por exemplo, se você tem um conjunto de dados que possui um ID para cada amostra, não é recomendável você mantê-la em seu conjunto de dados. O mesmo vale para, por exemplo, nome de pessoa caso seja único para cada amostra, é aconselhável você não manter.

Outro caso é caso a sua feature possua uma grande quantidade de valores nulos, ao imputar dados pode acontecer de você inserir um viés, então em algumas situações é mais aconselhável retirar essa feature.

Então sempre vai depender de como está seu conjunto de dados. Você deve permanecer com as features que tenham dados de qualidade, quanto mais dados de qualidade você inserir para seu modelo se ajustar, melhores resultados você obterá.

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software