Olá, pessoal!
Nesta etapa, dei continuidade ao fluxo de clusterização com foco na interpretação dos agrupamentos criados pelo modelo KMeans. Depois de preparar os dados, aplicar One-Hot Encoding, escalar as variáveis com MinMaxScaler e treinar o modelo com 3 clusters, o objetivo passou a ser entender o perfil de cada grupo formado.
Como o modelo foi treinado com os dados escalados, o primeiro passo foi reverter a escala utilizando o inverse_transform do scaler previamente treinado. Essa etapa é importante porque os dados escalados entre 0 e 1 são úteis para o modelo, mas não são tão intuitivos para análise humana. Ao retornar os valores para a escala original, fica mais fácil interpretar as características reais de cada agrupamento.
Em seguida, criei um novo DataFrame chamado dados_analise, contendo os dados revertidos para a escala original. Também adicionei a coluna cluster, utilizando os rótulos atribuídos pelo modelo KMeans. Com isso, foi possível agrupar os registros por cluster e calcular a média dos atributos de cada grupo.
Depois, transpus a tabela de médias para facilitar a comparação entre os clusters e ordenei os atributos de cada grupo em ordem decrescente. Essa análise permitiu identificar quais características eram mais fortes em cada agrupamento.
Com base nas médias analisadas, foi possível interpretar os três grupos principais: o grupo 0 apresentou um perfil mais jovem, com forte interesse em moda, música e aparência; o grupo 1 demonstrou maior associação com esportes, especialmente futebol americano, basquete e interesses culturais como banda e rock; já o grupo 2 apresentou um comportamento mais equilibrado, com interesses ligados a música, dança e moda.
Essa etapa foi importante porque mostrou que a clusterização não termina no treinamento do modelo. Depois que os grupos são criados, é necessário interpretá-los para transformar os resultados em informação útil e apoiar decisões, como estratégias de marketing, personalização de conteúdo ou segmentação de usuários.
Link do repositório:
https://github.com/Moquiuti/Clusteriza-o-Lidando-com-dados-sem-r-tulo/blob/main/atividade_desvendando_agrupamentos.py