Olá Eduardotudo certinho?
Então, não adiantaria replicar utilizando apenas um filme, para replicar o resultado você precisa de toda a base de dados, ou então obter o valor da média e do desvio padrão de cada gênero
scaler.mean #tirar a média
scaler.var_ #determinar a variância
import numpy as np
np.sqrt (scaler.var_) #calcular a raiz quadrada da variância que é o desvio padrão
Você está correto na sua percepção, não tem como saber qual é o gênero com mais significância em cada filme, apenas como esses dados.
O que foi feito é que foi gerado dois pesos para todos os gêneros um com 1 e outro com 0 (zero), mas não tá relacionado ao filme, mas sim a quantidade de filmes daquele gênero dentro da base de dados, o que pode gerar problemas, pois dependendo da quantidade de cada gênero, irá formar "pesos" distintos que impossibilitarão a classificação correta posterior a normalização. O cálculo do StandardScaler é calcular a média, calcular o desvio padrão e normalizar.
Faremos uma nota abaixo do vídeo explicando melhor e provavelmente será regravada essa aula.
Espero ter te ajudado e obrigado pela ajuda!