Na aula foi definido o valor 5, mas como posso saber um valor otimizado para o numero de clusters?
Na aula foi definido o valor 5, mas como posso saber um valor otimizado para o numero de clusters?
Olá, Vladimir, tudo bem?
Há algumas técnicas que ajudam a encontrar um valor adequado. Uma das mais comuns é o método do cotovelo (Elbow Method). Nessa técnica, você deverá calcular a soma das distâncias quadradas dentro dos clusters (Inertia) para diferentes valores de n_clusters
. Por exemplo, você pode testar valores de 1 a 10.
Em seguida, você pode plotar um gráfico com o número de clusters no eixo x e a inércia no eixo y. No gráfico gerado, o ponto onde a redução na inércia começa a diminuir, chamamos de cotovelo. Esse ponto geralmente indica um bom número de clusters.
Deixo o link da documentação para consulta, ela está em inglês, mas você poderá utilizar a tradução automática do navegador:
Espero ter ajudado.
Qualquer dúvida, compartilhe no fórum.
Abraços e bons estudos!