Na aula é apresentado:
scaler = StandardScaler()
generos_escalados = scaler.fit_transform(generos)
Porém, temos que as variáveis generos são binárias. Na documentação deixa claro que padronizar é subtrair da média e dividir pelo desvio padrão (https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.StandardScaler.html)
No entanto, faz sentido padronizar uma variável binária? Qual literatura dá suporte a isso?
Pesquisei e não vi um consenso sobre, alguns dizem que não faz sentido e outros dizem que pode, mas não aconselham.
Além disso, o uso do K-Means para variáveis categóricas não está coerente, visto que a noção de distância fica deturpada. Correto?