Olá,
Gostaria de saber se na hora de fazer o fit teria com as labels dos clusters ficarem ordenadas pelo valor de uma das colunas. Por exemplo, o cluster 0 ficar com os menores valores da coluna Total e assim por diante.
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Olá,
Gostaria de saber se na hora de fazer o fit teria com as labels dos clusters ficarem ordenadas pelo valor de uma das colunas. Por exemplo, o cluster 0 ficar com os menores valores da coluna Total e assim por diante.
Olá, Bibiana! Tudo bem com você?
Não conseguimos ordenar uma cluster utilizando somente uma coluna (feature). O algoritmo kmeans atribui o cluster com base nas distâncias entre uma amostra e outra levando em consideração todas as features no conjunto de dados.
Os algoritmos que realizam a clusterização das amostras são não supervisionados, logo não sabemos quais respostas obteremos ao realizar o .fit(). O importante é que as amostras que possuem características semelhantes estejam presentes no mesmo cluster. Então por exemplo se a primeira amostra for atribuída ao terceiro cluster todas as amostras que se parecerem com a primeira estarão no terceiro cluster também.
Espero ter ajudado, mas se ainda persistir alguma dúvida estou sempre à disposição.
:)