Olá Afonso! Tudo bem com você??
Então se você perceber, o professor informa que o fato de dar 100% é considerado um erro da máquina, pois é um resultado irreal. Observa a transcrição do vídeo:
"Mas esse resultado é um pouco estranho, não? Após uma verificação, perceberemos que não parece existir nada de errado no código. Porém, o executarmos novamente, teremos resultados variáveis, como 96%, 92% e até 100% novamente.
Isso ocorre porque o algorítimo train_test_split, por padrão, realiza aleatoriamente a separação de dados de treino e teste. Desse modo, todas as vezes que ele é executado podemos ter um resultado diferente.
Então como podemos fazer com que o nosso experimento seja replicável?
Precisaremos definir um número inicial para os algorítimos de geração de números aleatórios. Esse número inicial é chamado SEED, e nesse caso usaremos o número 20. Em seguida, definiremos para o train_test_split o uso do random_state = SEED."
Na transcrição acima, também é informado uma maneira para que os testes possam ser replicados. Para isso é utilizado um recurso chamado SEED, que é capaz de tirar a aleatoriedade ao definirmos um valor fixo.
Existe uma máxima que se a IA estiver resultando em 100%, então algo não está certo. Você pode guardar os resultados declarando variáveis, porém, neste caso do exemplo da aula, não adiantaria pelo sentido da aleatoriedade e que não temos acesso ao processo utilizado "por trás" da biblioteca do SKLearn.
Espero ter te ajudado e qualquer dúvida é só retornar aqui! Bons estudos Afonso!