eu n sei se tem algo errado com o codigo ou se o meu prosesador esta trabalhando mais e piora o desempenho mas o codigo é
import pandas as pd
from sklearn.naive_bayes import MultinomialNB
from collections import Counter
dados = pd.read_csv('busca.csv')
A = ['home','bus','logado']
x = dados[A]
y = dados['comprou']
X_df = pd.get_dummies(x)
Y_df = y
X = X_df.values
Y = Y_df.values
pdt = 0.9
dollynho_seu_amiginho = MultinomialNB()
mde = int(pdt*len(Y))
mdt = len(Y) - mde
mm = X[:mde]
mt = Y[:mde]
nn = X[-mdt:]
nt = Y[-mdt:]
dollynho_seu_amiginho.fit(mm,mt)
bu = dollynho_seu_amiginho.predict(nn)
c1 = max(Counter(nt).values())
c3 = 100.0*float(c1)/len(nt)
r = bu == nt
acertos = [d for d in r if d == 0]
total_de_acertos = len(acertos)
total_de_elementos = len(nn)
taxa_de_acerto = 100.0 * total_de_acertos / total_de_elementos
print(f'us control is {c3} for the result of {taxa_de_acerto}')
print(total_de_elementos)
a resposta é
us control is 82.0 for the result of 18.0
100
agora o resultado era para ser (ou no professor ou o meu desempenho normal) era para ser
us control is 82.0 for the result of 82.0
100
n sei se eu errei o codigo ou se foi desempenho então pf me esclaresam