Considerações: Se testarmos apenas com a mesma base de dados para treino e teste, nestes modelos teremos sempre os mesmos resultados. Entretanto, na vida real provavelmente não teremos dados tão comportados.
Foram geradas bases de treino e teste aleatórios usando os nossos dados em 3 situações:
1 - Totalmente aleatórios: Vamos supor que haja duas saídas, 0 (70% das vezes) e 1 (30% das vezes) . As amostras de treino e teste não respeitaram essa proporção.
2 - Aleatório, mas com Y proporcional: Caso haja uma proporção de 0 (70% das vezes) e 1 (30% das vezes), as amostras de treino e teste tentaram manter essa proporção variando apenas o X.
3 - Registro único: Foram mantidos apenas registros únicos. Mesmo que em uma base de dados, algo ocorra centenas de vezes, foi ensinado apenas uma vez aquele padrão, sem informar quantas vezes ele ocorria. Com isso a nossa base teve 45 registros únicos e comparando tanto com o teste de mesmo tamanho e condições das demais simulações como com toda a base de dados.
Abaixo segue o resultado: