1
resposta

Como "kmeans.cluster_centers_" funciona por baixo dos panos ?

Cada cluster tem o seu centróide, mas como assim esse método retorna um centróide para cada um dos atributos ?

1 resposta

Olá, Guilherme!

O método "kmeans.cluster_centers_" do algoritmo K-Means em Python retorna as coordenadas dos centróides de cada cluster. O K-Means é um algoritmo de agrupamento que tem como objetivo dividir os dados em 'k' grupos diferentes, onde 'k' é um número definido pelo usuário.

Cada grupo é representado por um ponto central, chamado de centróide. Esse ponto não é necessariamente um dos pontos de dados, mas é a média (ou centro) de todos os pontos que pertencem a esse grupo.

Quando você diz que o método retorna um centróide para cada um dos atributos, na verdade, ele está retornando as coordenadas desse centróide no espaço de atributos. Por exemplo, se você tem um conjunto de dados com dois atributos (digamos, altura e peso), o método "kmeans.cluster_centers_" retornará as coordenadas desses centróides no espaço bidimensional formado por altura e peso.

Então, se você tem 3 clusters, o método retornará algo como:

[[altura_media_cluster1, peso_medio_cluster1],
 [altura_media_cluster2, peso_medio_cluster2],
 [altura_media_cluster3, peso_medio_cluster3]]

Reforço que em casos de dúvidas, conte sempre com o fórum da comunidade Alura! Bons estudos!

Sucesso

Um grande abraço e até mais!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software