Ainda não tem acesso? Estude com a gente! Matricule-se
Ainda não tem acesso? Estude com a gente! Matricule-se

Não entendi a lógica de obtenção do modelo final usando o Cross Validate.

Pelo o que eu entendi, o Cross Validate não treina o modelo e devemos treinar com todos os dados que foram passados para o Cross Validate, mas se eu passar todos os dados de x e y(sem separar em treino e teste) o algoritmo não irá ficar 'viciado'? Minha interpretação de separar entre treino e teste é para evitar isso, mas por que nesse caso eu posso treinar com todos?

1 resposta

Olá Breno.

Na verdade, essa estrategia, de separar os dados em treino e teste, é utilizada apenas enquanto você está validando seu modelo, estudando como ele vai se sair para o seu problema.

Após feito o seu estudo e escolhido o seu modelo, você vai querer entregar para o treinamento o máximo de dados que conseguir, mas sim, ainda podemos cair em um modelo viciado, por isso devemos cuidar que não entreguemos dados com pouca diversidade.

Bons Estudos.

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software