Olá.
Como forma de coletar as melhores categorias para o problema fica o código abaixo.
centroids = kmeans.cluster_centers_
melhores_categorias={}
max = len(centroids[0])
for i in range(max):
melhores_categorias.update({i:{'label':dados.columns.values[i],'values':centroids[:, i].var()}})
melhores_categorias = pd.DataFrame(melhores_categorias).T
melhores_categorias.sort_values(by=['values'], ascending=False, inplace=True)
melhores_categorias.head(6)