Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Cálculo do score no caso do chute

Se os mesmos dados devem ser usados para comparar os algoritmos, por que então a taxa base de acerto (a do "chute") é calculada usando o data frame inteiro e o score do algoritmo é calculado somente com os dados do conjunto de validação? (E por que não é usada a operação MultinomialNB.score pra isso?)

1 resposta
solução!

Oi André!

Não sei se entendi corretamente a sua pergunta, mas o que você está dizendo é que os dados usados no cálculo do algoritmo "burro" são diferentes daqueles usados para calcular o MultinomialNB?

No caso, que esta taxa de acerto base abaixo

taxa_de_acerto_base = 100.0 * max(acerto_de_um, acerto_de_zero) / len(Y)

está considerando todo o dataframe e o do Multinomial apenas 90%?

Se a dúvida for essa, sim, você está certíssimo na observação, e o código é refatorado na aula 8 :p.

Caso não seja isso, só mandar aqui.