Tenho uma dúvida. Se ao invés de eu usar o StandardScaler da forma como o professor fez, e se eu fizer de uma maneira diferente?:
O que eu pensei foi o seguinte: Eu poderia dividir os grupos, estratificar, e até aplicar StandardScaler nos dados, tudo isso logo após carregar o dataset?
Após isso E aí com o dataset já tratado, transformado, dividido e balanceado, eu usar isso pra treinar no hold-out, ou então via cross-validation, sem precisar especificar grupos, nem outras coisas? Ou seja, eu já fiz todos os tratamentos antes de começar a treinar o modelo?
Isso que eu descrevi seria uma alternativa valida pra treinar um modelo de uma boa forma eficaz?