Eu notei que ao colocar o código para o dummy com a estratégia most_frequent, faltou adicionar o parâmetro na inicialização do dummy.
Então na prática os dois dummy (dummy_stratified e dummy_mostfrequent) utilizam a mesma estratégia default: stratified
Código do vídeo:
from sklearn.dummy import DummyClassifier
dummy_stratified = DummyClassifier()
dummy_stratified.fit(treino_x, treino_y)
acuracia = dummy_stratified.score(teste_x, teste_y) * 100
print("A acurácia do dummy stratified foi {:.2f}%".format(acuracia))from sklearn.dummy import DummyClassifier
dummy_mostfrequent = DummyClassifier()
dummy_mostfrequent.fit(treino_x, treino_y)
acuracia = dummy_mostfrequent.score(teste_x, teste_y) * 100
print("A acurácia do dummy mostfrequent foi {:.2f}%".format(acuracia))No entanto, a acurácia dos dois foi diferente (52.44% e 50.68% respectivamente). Quando rodamos o código inteiro (para rodar a célula com o SEED) o resultado dos dois não deveria ser o mesmo?