Não entendi o conceito da Padronização. Podem me ajudar?
Não entendi o conceito da Padronização. Podem me ajudar?
Olá Eduardo, tudo bem? Espero que sim!
Para entender o que é padronização, você precisa entender os conceitos de média aritmética e desvio padrão.
A média aritmética nada mais é do que a soma de todos os valores dividido pela quantidade de valores. Ela nos dá um entendimento de um valor intermediário no qual os nossos dados estão centrados.
O desvio padrão, raiz quadrada da variância, mede o quão dispersos os dados estão em relação à média. Nos dá a ideia se os dados estão concentrados ou muito afastados de um valor central.
A padronização é uma transformação dos nossos dados. Para cada um dos valores do conjunto de dados, vamos subtrair o valor da média e depois dividir pelo desvio padrão. Dessa forma obteremos um novo conjunto de dados com média 0 e desvio padrão igual a 1. Essa transformação é útil para compararmos conjuntos de dados que estão em escalas muito distintas.
Imagine que você quer comparar a idade e o salário de um conjunto de pessoas. Os valores da idade estão em escalas de dezenas (18-70 anos por exemplo), já os salários estão em escalas de milhares (1000 a 8000 reais por exemplo). Ao realizar uma padronização na variável idade e uma padronização na variável salário, teremos a escala com valores próximos a 0, sendo mais fácil a comparação e o salário não vai impactar mais do que a idade caso utilize algum modelo matemático só por ter uma escala muito maior.
Espero que tenha tirado sua dúvida.
Estou à disposição. Bons estudos!