1
resposta

[Dúvida] Multicolinearidade

Foi dito durante a aula (aos 3:32 do vídeo) que a técnica do PCA é uma técnica de modelagem não-supervisionada.

Entretanto, será que não é possível usar essa técnica do PCA para modelos de aprendizado supervisionados? Por exemplo, temos um modelo de Regressão Logística em que existe uma multicolinearidade entre os dados. Será que não podemos usar a técnica do PCA como um pré-processamento para a remoção da multicolinearidade no modelo e logo em seguida aplicar normalmente o modelo de aprendizado supervisionado (uma Reg. Logística, por exemplo)?

Se não for possível usar a técnica do PCA para a remoção da multicolinearidade entre os dados de uma Reg. Logística, qual (ou quais) técnicas então poderiam ser usadas? Regularização utilizando Lasso? Quais?

Não sei se consegui ser claro.

1 resposta

Olá Roberto,

A técnica PCA pode ser usada como um pré-processamento de dados em um problema de aprendizado supervisionado. Porém, ela não seria a técnica de aprendizado supervisionado em si porque ela não para fazer a previsão que fazemos com os métodos supervisionados. Parece que você mesmo percebeu isso na primeira parte da pergunta.

Quanto a quais poderiam ser utilizadas vai depender muito do problema. Por exemplo, a regularização usando Lasso penaliza os coeficientes dos recursos, forçando alguns deles a zero, o que efetivamente remove recursos menos importantes e pode ajudar a reduzir a multicolinearidade. Então, eu começaria por aí. Também existem outras transformações de variáveis, como diferenciação ou transformação logarítmica, que podem ser aplicadas dependendo do problema que você está tentando resolver.