1
resposta

Padronizacao de dados (standardScaler)

Ola, sei que foi utilizado o standardscaler no algoritmo svc e linear svc. Mas gostaria de entender melhor a teoria, em que situações devemos padronizar a massa de dados, e para quais algoritmos esse tipo de operação pode ajudar a trazer melhores resultados?

1 resposta

Olá Gisele.

Utilizamos o StandardScaler quando nosso dados estão com escalas muito diferentes, como no exemplo apresentado na aula no tempo 7:32, e quando estamos utilizando algoritmos do tipo Support Vector Machine que acabam dando pesos errados nas variações caso as escalas não estejam proporcionais.

Algoritmos como DecisionTreeClassifier apresentado na aula no tempo 10:53, não precisam dos dados reescalados já que eles já são normalizados dentro do próprio algoritmo .

Então sempre que seus dados estivem com escalas muito distintas e estiver um algoritmo do tipo SVM, mudar a escala dos dados podem ser benéfico.

Espero ter ajudado, bons estudos.