1
resposta

DummyClassifier(*, strategy='prior', random_state=None, constant=None)

E ai instrutor de plantão, blz? Tenho 1 duvida

Código do vídeo sobre o DummyClassifier

from sklearn.dummy import DummyClassifier

dummy_stratified = DummyClassifier()
dummy_stratified.fit(treino_x, treino_y)
acuracia = dummy_stratified.score(teste_x, teste_y) * 100

print("A acurácia do dummy stratified foi %.2f%%" % acuracia)

from sklearn.dummy import DummyClassifier

dummy_mostfrequent = DummyClassifier()
dummy_mostfrequent.fit(treino_x, treino_y)
acuracia = dummy_mostfrequent.score(teste_x, teste_y) * 100

Minha duvida ta aqui Linha 3 | dummy_stratified = DummyClassifier() Linha 12 | dummy_mostfrequent = DummyClassifier()

Fui olhar na documentação e o DummyClassifier usa o parâmetro strategy="prior", logo nem stratified nem most_frequent foram utilizados class sklearn.dummy.DummyClassifier(*, strategy='prior', random_state=None, constant=None)

Sendo assim, a implementação não deveria ser: Linha 3 | dummy_stratified = DummyClassifier(strategy='stratified') Linha 12 | dummy_mostfrequent = DummyClassifier(strategy='most_frequent')

Exemplo de como em fiz

from sklearn.dummy import DummyClassifier
SEED = 42
dummy_stratified = DummyClassifier(random_state=SEED, strategy="stratified")
dummy_stratified.fit(treino_x,treino_y)
dummy_stratified_score = dummy_stratified.score(treino_x,treino_y)
print(f"a acurarica do dummy stratified foi de {dummy_stratified_score}")


dummy_most_frequent = DummyClassifier(random_state=SEED, strategy='most_frequent')
dummy_most_frequent.fit(treino_x,treino_y)
dummy_most_frequent_score = dummy_most_frequent.score(treino_x,treino_y)
print(f"a acurarica do dummy most frequent foi de {dummy_most_frequent_score}")

Aguardo o retorno e agradeço desde já.

1 resposta

Oii Débora, tudo bem?

Desculpa a demora em te dar um retorno aqui na questão.

Você está correta! Quando esse curso foi gravado, era uma outra versão da biblioteca sklearn e o valor de default em strategy era stratified, mas com a atualização da versão, a documentação até ganhou uma nota de atenção sobre a alteração do valor de default, obrigada por nos avisar sobre!

Sobre o most_frequent, o instrutor Guilherme esqueceu de colocar enquanto fazia no vídeo, mas na parte da transcrição da aula o código conta com o strategy='most_frequent'. Como o valor de default mudou, vamos mudar na transcrição também, inserindo o strategy='stratified' como você sugeriu!!

Obrigada novamente e bons estudos ^^