Galera, não consegui entender a motivação de realizar esses testes com dados reais (3ªfase) , após a escolha do algoritmo de classificação de melhor desempenho para aquele conjunto de dados.
Eu entendi que devemos treinar os dados (1ª fase), depois testá-los (2ª fase) para descobrirmos o melhor algoritmo de classificação, E ,achado o melhor algoritmo, devemos validá-los com dados reais.
Mas para que exatamente precisamos validar com esses dados reais? Não já sabemos o desempenho do algoritmo, ao realizar o teste da 2ª fase? Não já sabemos qual é o melhor entre os dois ? Por que precisamos realizar outro teste? Eu entendi perfeitamente a implementação do ponto de vista da codificação, o que não entendi exatamente é a motivação de fazer isso. Não seria suficiente terminar na fase 2?
Obrigado, aguardo respostas :)