Acredito que deveria ser melhor explicado, como é feita essa Escala

Eduardo Moraes Ritter · 2020-03-25 11:36

No inicio achei que fosse um numero aleatório esse o funcionamento do sklearn.preprocessing.StandardScaler, porque não fazei sentido pra mim como ele sabe qual a relevância da categoria dentro das c

Olá Eduardotudo certinho?

Então, não adiantaria replicar utilizando apenas um filme, para replicar o resultado você precisa de toda a base de dados, ou então obter o valor da média e do desvio padrão de cada gênero

scaler.mean #tirar a média
scaler.var_ #determinar a variância
import numpy as np
np.sqrt (scaler.var_) #calcular a raiz quadrada da variância que é o desvio padrão

Imgur

Você está correto na sua percepção, não tem como saber qual é o gênero com mais significância em cada filme, apenas como esses dados. O que foi feito é que foi gerado dois pesos para todos os gêneros um com 1 e outro com 0 (zero), mas não tá relacionado ao filme, mas sim a quantidade de filmes daquele gênero dentro da base de dados, o que pode gerar problemas, pois dependendo da quantidade de cada gênero, irá formar "pesos" distintos que impossibilitarão a classificação correta posterior a normalização. O cálculo do StandardScaler é calcular a média, calcular o desvio padrão e normalizar. Faremos uma nota abaixo do vídeo explicando melhor e provavelmente será regravada essa aula.

Espero ter te ajudado e obrigado pela ajuda!

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP