No curso de aprendizado não-supervisionado, enquanto o instrutor pré-processa os dados do dataframe antes de começar a explorar o KMeans, foi justificado no vídeo a necessidade de escalar os dados das colunas de cada gênero de filme, que podem ter valor 0 ou 1. Entretanto, há uma ERRATA informando que "quando as features apresentam escalas diferentes é uma boa pratica fazer o escalonamento para que os algoritmos não sejam afetados pela diferença de escala entre as features".
A errata sugere transformar os gêneros em dados categóricos e aplicar variações do k-means conhecida como k-modes (e indica um paper). Alguém conseguiu fazer usando o k-modes? O paper indicado tem um formalismo matemático muito complexo. A Alura poderia ter facilitado indicando um link mais prático.