Existem referências para os valores de explained_variance_ratio_? Como sei que o modelo está bom por essas métricas?
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Existem referências para os valores de explained_variance_ratio_? Como sei que o modelo está bom por essas métricas?
Olá, Vladimir, tudo bem?
Na verdade, não há valores fixos que determinam se o modelo está "bom" ou "ruim" apenas com base no explained_variance_ratio_. Mas há algumas
diretrizes que podem ajudar. Geralmente, você quer que os primeiros componentes principais expliquem uma grande proporção da variância total. Por exemplo, se os primeiros 2 ou 3 componentes explicam 80% ou mais da variância, isso é um bom sinal de que a redução de dimensionalidade está capturando bem a estrutura dos dados.
Além disso, você pode plotar a variância explicada acumulada (soma cumulativa do explained_variance_ratio_) e observar o ponto onde a curva começa a se estabilizar (o "cotovelo", como falei no seu outro tópico). Esse ponto pode indicar um bom número de componentes a serem considerados.
Espero ter ajudado.
Qualquer dúvida, compartilhe no fórum.
Abraços e bons estudos!