2
respostas

Normalizar antes de dividir em treino e teste há vazamento de informacao?

No caso, foi feita a normalização dos dados antes da divisão em treino e teste. Ja estudei anteriormente que ao fazer isso haverá vazamento de informacão entre ambos datasets. Isso é sempre recomendado ou em certas ocasioes não faz diferenca?

2 respostas

Oii, Matheus! Tudo bem?

Isso mesmo, você está certo! É sempre uma boa prática realizar a normalização dos dados depois da divisão de dados. Neste contexto da aula, por didática e em algumas situações específicas, como quando se trabalha com conjuntos de dados muito pequenos e estudos, pode-se considerar normalizar antes da divisão, mas isso deve ser feito com cautela e sempre com a consciência de que pode haver um risco de vazamento de informação.

Espero ter ajudado, conte sempre conosco para te auxiliar.

Bons estudos e até mais!

Obrigado!!!