bom dia,
Estava vendo a aula que trata do pipeline no sklearn e não entendi essa parte. Não entendi porque não se pode simplesmente pegar o conjunto todo de dados, não apenas o de treino , mais o de treino e teste de treino juntos, escalar e depois usar o cross validate. Não entendi a necessidade de se reescalar os dados em cada etapa do cross validate.