1
resposta

Por que o scaler deve ser rodado múltiplas vezes?

Uma vez scaled, x_azar_escalado vai mudar a medida que o modelo é treinado? Se x_azar_escalado é um conjunto íntegro e imutável, o scaler não vai sempre retornar o mesmo conjunto de dados?

Outra coisa que não entendo é como conseguimos treinar o modelo com dados escalados e depois usar dados de teste não escalados. A parametrização do modelo não vai ser calculada no fit para um X com entradas muito menores? No meu entendimento é quase igual criar um equacionamento com parâmetros considerando unidades em metros e depois usar kilômetros.

1 resposta

Oi Larissa, tudo bom?

Na verdade estamos usando os dados escalonadas tanto no treino quanto no teste. Imagino que você esteva falando de momento em que ele usa o Pipeline, correto?

Nesse momento ele definiu o pipeline, ele faz com que todos os dados passados para o crossvalidade sejam passados tanto pelo scaler quanto pelo modelo. E como no parâmetro cv ele define qual vai ser o algoritmo de crossvalidation que é executado.

No fundo ele está aplicando o mesmo tratamento para todos os dados, tanto os de teste quanto os de treino.