Eu notei que ao colocar o código para o dummy com a estratégia most_frequent
, faltou adicionar o parâmetro na inicialização do dummy.
Então na prática os dois dummy (dummy_stratified
e dummy_mostfrequent
) utilizam a mesma estratégia default: stratified
Código do vídeo:
from sklearn.dummy import DummyClassifier
dummy_stratified = DummyClassifier()
dummy_stratified.fit(treino_x, treino_y)
acuracia = dummy_stratified.score(teste_x, teste_y) * 100
print("A acurácia do dummy stratified foi {:.2f}%".format(acuracia))
from sklearn.dummy import DummyClassifier
dummy_mostfrequent = DummyClassifier()
dummy_mostfrequent.fit(treino_x, treino_y)
acuracia = dummy_mostfrequent.score(teste_x, teste_y) * 100
print("A acurácia do dummy mostfrequent foi {:.2f}%".format(acuracia))
No entanto, a acurácia dos dois foi diferente (52.44%
e 50.68%
respectivamente). Quando rodamos o código inteiro (para rodar a célula com o SEED
) o resultado dos dois não deveria ser o mesmo?