Se os mesmos dados devem ser usados para comparar os algoritmos, por que então a taxa base de acerto (a do "chute") é calculada usando o data frame inteiro e o score do algoritmo é calculado somente com os dados do conjunto de validação? (E por que não é usada a operação MultinomialNB.score
pra isso?)