1
resposta

Dúvida sobre o centro de cada cluster

E ai, Yuri. Tudo bem? Estou gostando bastante do curso mas fiquei com uma dúvida. Vamos lá:1 - Nós pegamos nosso DataFrame de gêneros e aplicamos um scaler nele para poder ter melhores comparações de características (não apenas 0s e 1s).2 - Ao treinar nosso algoritmo com o DataFrame do item 1, você resolve printar o centro de cada cluster, isso em 20 dimensões. Na minha cabeça, quanto mais próximo de 0 o valor da coordenada de um gênero, mais atrelado aquele cluster ele estaria. No entanto no curso é falado o contrário. Poderia explicar melhor? Quando plotamos o gráfico de barra transposto, já que estamos falando de coordenadas, penso que o gênero que tiver a barra menor naquele gráfico é o gênero que pertence àquele cluster. Obrigado pela atenção.

1 resposta

Olá Alex tudo bem com você??

Os recursos de ML realmente ganham grande poder quando visualizados em gráficos e tentarei te explicar o que foi feito na aula em cima de um gráfico específico. Este aqui:

Imgur

Observando esse gráfico podemos visualizar a questão por você levantada quanto a "barra menor pertencer aquele gênero/cluster". Vamos analisar a informação que temos ali disposta: Eixo X composto por gêneros de filmes, total de 20. Eixo Y composto pela métrica do quanto aquele filme pertence aquele gênero. E tudo isso em 3 grupos representados em 3 gráficos distintos com as mesmas informações mas categorizados pelo ML de formas diferentes, em cima de cada resultado! Onde este resultado mostra a tendência de cada filme justificando a presença no grupo para os resultados positivos (acima de zero) e indicando com negativo (abaixo de zero)os filme que mais se diferem. No grupo 3 que o Yuri explica, estão os filmes de comédia romântica, pois são as barras positivas mais acentuadas, gerando o gênero do grupo, e é possível observar todos os outros abaixo, facilitando o entendimento e leitura das informações mostradas no gráfico. Acredito que o motivo da sua dúvida tenha acontecido por dois fatores. O primeiro que o gráfico de barras veio após a visualização dos centróides, que sim, fazem acreditar nessa questão de valor mais próximo do zero estão juntos e justificam a categoria, e segundo por conta do gráfico de barras exigir uma leitura e observação para o entendimento, quanto a forma que ele foi montado e o que estava previsto de ser visualizado.

Se a minha resposta te ajudou, fico muito feliz =D e peço que por favor encerre o Post marcando a dúvida como resolvida! Caso precise de ajuda é só voltar aqui e perguntar.

Obrigado

Victor Gonzalez