1
resposta

Não entendi a lógica de obtenção do modelo final usando o Cross Validate.

Pelo o que eu entendi, o Cross Validate não treina o modelo e devemos treinar com todos os dados que foram passados para o Cross Validate, mas se eu passar todos os dados de x e y(sem separar em treino e teste) o algoritmo não irá ficar 'viciado'? Minha interpretação de separar entre treino e teste é para evitar isso, mas por que nesse caso eu posso treinar com todos?

1 resposta

Olá Breno.

Na verdade, essa estrategia, de separar os dados em treino e teste, é utilizada apenas enquanto você está validando seu modelo, estudando como ele vai se sair para o seu problema.

Após feito o seu estudo e escolhido o seu modelo, você vai querer entregar para o treinamento o máximo de dados que conseguir, mas sim, ainda podemos cair em um modelo viciado, por isso devemos cuidar que não entreguemos dados com pouca diversidade.

Bons Estudos.