1
resposta

Ordem dos clusters com base em uma coluna

Olá,

Gostaria de saber se na hora de fazer o fit teria com as labels dos clusters ficarem ordenadas pelo valor de uma das colunas. Por exemplo, o cluster 0 ficar com os menores valores da coluna Total e assim por diante.

1 resposta

Olá, Bibiana! Tudo bem com você?

Não conseguimos ordenar uma cluster utilizando somente uma coluna (feature). O algoritmo kmeans atribui o cluster com base nas distâncias entre uma amostra e outra levando em consideração todas as features no conjunto de dados.

Os algoritmos que realizam a clusterização das amostras são não supervisionados, logo não sabemos quais respostas obteremos ao realizar o .fit(). O importante é que as amostras que possuem características semelhantes estejam presentes no mesmo cluster. Então por exemplo se a primeira amostra for atribuída ao terceiro cluster todas as amostras que se parecerem com a primeira estarão no terceiro cluster também.

Espero ter ajudado, mas se ainda persistir alguma dúvida estou sempre à disposição.

:)

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software