Dúvida sobre a validação | Machine Learning: classificação por trás dos panos

Olá Vinícius! Tudo bom com você?

As etapas de validação e teste mostradas na aula possuem objetivos um pouco diferentes, mesmo que ambas estejam testando o modelo. Como você mesmo pontuou, na etapa de teste o algoritmo é testado de forma que o modelo vitorioso é o que tem a melhor taxa de acerto a partir de uma amostra de teste. Mas depois disso, como saber se, com outras amostras, esse modelo vitorioso ainda vai manter sua taxa de acerto naquele valor definido no teste? Como saber se o modelo aprendeu corretamente na fase de treinamento e vai conseguir se sair bem com outras amostras? Essas perguntas são respondidas na etapa de validação, que vai funcionar como um novo teste avaliativo, e a partir dos dados obtidos neste novo teste vemos se o modelo se comportou como esperado.

Notamos na aula que a acurácia obtida com os dados de teste não é muito distante da acurácia obtida com os dados de validação, o que nos mostra que o modelo está se comportando de acordo com seu nível de treino. Se os valores fossem muito distintos poderíamos dizer que teria ocorrido algum problema no treinamento por exemplo, o que não foi o caso.

Esse foi um tipo de aplicação da etapa de validação, mas essa etapa é muito importante. Em outros tipos de aprendizado de máquina, como por exemplo, em Deep Learning a fase de validação é utilizada para otimizar o aprendizado do modelo, permitindo que ele aprenda em uma qualidade melhor. Se tiver interesse em saber mais, dê uma olhadinha na formação Machine Learning Avançada.

Eu espero ter te ajudado! Qualquer outra dúvida estarei disposta a sanar ;-)

Bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!