1
resposta

Acredito que deveria ser melhor explicado, como é feita essa Escala

No inicio achei que fosse um numero aleatório esse o funcionamento do sklearn.preprocessing.StandardScaler, porque não fazei sentido pra mim como ele sabe qual a relevância da categoria dentro das categoria de um filme, to tentando replicar a conta matemática para apenas um filme.

1 resposta

Olá Eduardotudo certinho?

Então, não adiantaria replicar utilizando apenas um filme, para replicar o resultado você precisa de toda a base de dados, ou então obter o valor da média e do desvio padrão de cada gênero

scaler.mean #tirar a média
scaler.var_ #determinar a variância
import numpy as np
np.sqrt (scaler.var_) #calcular a raiz quadrada da variância que é o desvio padrão

Imgur

Você está correto na sua percepção, não tem como saber qual é o gênero com mais significância em cada filme, apenas como esses dados. O que foi feito é que foi gerado dois pesos para todos os gêneros um com 1 e outro com 0 (zero), mas não tá relacionado ao filme, mas sim a quantidade de filmes daquele gênero dentro da base de dados, o que pode gerar problemas, pois dependendo da quantidade de cada gênero, irá formar "pesos" distintos que impossibilitarão a classificação correta posterior a normalização. O cálculo do StandardScaler é calcular a média, calcular o desvio padrão e normalizar. Faremos uma nota abaixo do vídeo explicando melhor e provavelmente será regravada essa aula.

Espero ter te ajudado e obrigado pela ajuda!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software