No código da aula está assim:
Link do código na aula (https://cursos.alura.com.br/course/introducao-a-machine-learning-com-classificacao/task/14605)
acerto_base = max(Counter(teste_marcacoes).itervalues())
taxa_de_acerto_base = 100.0 * acerto_base / len(teste_marcacoes)
print("Taxa de acerto base: %f" % taxa_de_acerto_base)
A taxa de acerto é feito com base nas marcações de "TESTE" ou seja estamos comparando a eficácia de 1 algoritmo contra a média de respostas e não a média de treino
A taxa base de acerto é calculada pelos dados de "TESTE" e não pelos dados de "TREINO". Não deveria ser assim ?
acerto_base = max(Counter(treino_marcacoes).itervalues())
taxa_de_acerto_base = 100.0 * acerto_base / len(treino_marcacoes)
É comum isto no meio corporativo testar o algoritmo contra os dados do resultado do próprio teste (ao invés de treinar contra os dados do treino) ?