Existem referências para os valores de explained_variance_ratio_? Como sei que o modelo está bom por essas métricas?
Existem referências para os valores de explained_variance_ratio_? Como sei que o modelo está bom por essas métricas?
Olá, Vladimir, tudo bem?
Na verdade, não há valores fixos que determinam se o modelo está "bom" ou "ruim" apenas com base no explained_variance_ratio_
. Mas há algumas
diretrizes que podem ajudar. Geralmente, você quer que os primeiros componentes principais expliquem uma grande proporção da variância total. Por exemplo, se os primeiros 2 ou 3 componentes explicam 80% ou mais da variância, isso é um bom sinal de que a redução de dimensionalidade está capturando bem a estrutura dos dados.
Além disso, você pode plotar a variância explicada acumulada (soma cumulativa do explained_variance_ratio_
) e observar o ponto onde a curva começa a se estabilizar (o "cotovelo", como falei no seu outro tópico). Esse ponto pode indicar um bom número de componentes a serem considerados.
Espero ter ajudado.
Qualquer dúvida, compartilhe no fórum.
Abraços e bons estudos!