Ao comentar a célula de padronização com StandardScaler, o modelo passa a treinar com os dados em suas escalas originais. Como as características possuem intervalos diferentes, uma delas passa a exercer maior influência sobre a otimização, dificultando o ajuste dos pesos da rede. Com isso, o modelo resultante apresenta pior convergência, uma fronteira de decisão menos adequada e maior dificuldade para separar corretamente as três classes.
Esse experimento mostra a importância da padronização dos dados antes do treinamento de redes neurais, principalmente quando as variáveis de entrada possuem escalas diferentes.
Com StandardScaler:
loss caiu melhor e a acurácia ficou mais alta.
Sem StandardScaler:
loss caiu menos, a acurácia ficou inferior e a fronteira de decisão ficou pior ajustada.