1
resposta

Sobre o sklearn.preprocessing.StandardScaler

Olá a todos,

Salve engano, em outras aulas do Alura já foi abordado o assunto do StadardScaler. Se não foi lá, eu devo ter tido contato em outro lugar. Mas pelo que conheço do StandardScaler, ele apenas 'escala' os valores numéricos para que não haja desigualdade de tratamento entre colunas que possuem um range de valor diferente. Por exemplo, poderíamos ter uma coluna onde o valor varia de 0 a 10 e outra onde os valores variam de 0 a 255. Nesse caso, se aplicados direto a um algoritmo de aprendizado, a segunda coluna teria um peso maior devido ao seu 'range' quando na vdd essa não é a intenção. Na documentação do StandardScaler diz que o score é calculado na forma z = (x - u) / s (diferença pela média dividido pelo desvio padrão). O que me leva a crer mais nessa hipótese.

Mas esse é o entendimento que eu tenho sobre o assunto, estou levantando este tópico pois achei interessante ver a opinião do professor pois posso estar enganado.

1 resposta

Olá Victor tudo bem com você??

Eu entendo que você está correto na sua colocação e no caso o professor também. Por isso que ele transforma os dados em binários antes da aplicação da biblioteca <SkLearn pelo StandardScaler. Confirmando o que você analisou.

A questão é que o resultado do algoritmo, após a classificação, ele gera uma conversão, escalando os gêneros. Assim tendo a possibilidade de formação de grupos.

Se a minha resposta te ajudou, fico muito feliz =D e peço que por favor encerre o Post marcando a dúvida como resolvida! Caso precise de ajuda é só voltar aqui e perguntar.

Obrigado

Victor Gonzalez