1
resposta

[Dúvida] Porque treinar o reescalador?

Olá!

Não ficou claro pra mim porque devo treina o reescalador.

Porque fazer isso daqui? scaler.fit(X_train)

Existe algum problema em só tranformar as variáveis direto fazendo isso daqui:

X_train = scaler.fit_transform(X_train) X_test = scaler.fit_transform(X_test)

1 resposta

Oi Thiago!

Uma razão é que quando você usa scaler.fit(X_train), está calculando a média e o desvio padrão com os dados de treino, para depois transformar tanto o treino quanto o teste de forma consistente. Se você fizer scaler.fit_transform(X_train) e scaler.fit_transform(X_test), estará recalculando os valores para os dados de teste, o que cria uma inconsistência, pois o modelo foi treinado e testado com padrões de escalonamento diferentes. Isso pode distorcer os resultados, já que os dados de teste não seguem o mesmo padrão dos dados de treino.

Reforço que em casos de dúvidas, conte sempre com o fórum da comunidade Alura! Bons estudos!

Sucesso

Um grande abraço e até mais!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!