1
resposta

Como definir o valor de n_clusters?

Na aula foi definido o valor 5, mas como posso saber um valor otimizado para o numero de clusters?

1 resposta

Olá, Vladimir, tudo bem?

Há algumas técnicas que ajudam a encontrar um valor adequado. Uma das mais comuns é o método do cotovelo (Elbow Method). Nessa técnica, você deverá calcular a soma das distâncias quadradas dentro dos clusters (Inertia) para diferentes valores de n_clusters. Por exemplo, você pode testar valores de 1 a 10.

Em seguida, você pode plotar um gráfico com o número de clusters no eixo x e a inércia no eixo y. No gráfico gerado, o ponto onde a redução na inércia começa a diminuir, chamamos de cotovelo. Esse ponto geralmente indica um bom número de clusters.

Deixo o link da documentação para consulta, ela está em inglês, mas você poderá utilizar a tradução automática do navegador:

Espero ter ajudado.

Qualquer dúvida, compartilhe no fórum.

Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!