Boa noite, queria tirar uma dúvida sobre boa prática quando aplicar over ou undersampling. Em alguns tutoriais percebi que alguns aplicam under/oversampling apenas no dados de treino. Eles realizam o "train test split" e fazem o balanceamento apenas no x_train e y_train. Neste curso aplicou-se em tudo.
Tem alguma diferença prática? É uma escolha de quem vai fazer? Existe alguma regra/boa prática de quando utilizar no dataset todo ou só no conjunto de treino?
Obrigado