Olá,
Gostaria de saber se na hora de fazer o fit teria com as labels dos clusters ficarem ordenadas pelo valor de uma das colunas. Por exemplo, o cluster 0 ficar com os menores valores da coluna Total e assim por diante.
Olá,
Gostaria de saber se na hora de fazer o fit teria com as labels dos clusters ficarem ordenadas pelo valor de uma das colunas. Por exemplo, o cluster 0 ficar com os menores valores da coluna Total e assim por diante.
Olá, Bibiana! Tudo bem com você?
Não conseguimos ordenar uma cluster utilizando somente uma coluna (feature). O algoritmo kmeans
atribui o cluster com base nas distâncias entre uma amostra e outra levando em consideração todas as features no conjunto de dados.
Os algoritmos que realizam a clusterização das amostras são não supervisionados, logo não sabemos quais respostas obteremos ao realizar o .fit()
. O importante é que as amostras que possuem características semelhantes estejam presentes no mesmo cluster. Então por exemplo se a primeira amostra for atribuída ao terceiro cluster todas as amostras que se parecerem com a primeira estarão no terceiro cluster também.
Espero ter ajudado, mas se ainda persistir alguma dúvida estou sempre à disposição.
:)