3
respostas

[Dúvida] Tanto o SVC quanto o dummy estão dando a mesma acurácia

Boa tarde!

O modelo criado com o SVC e o dummy estão dando a mesma acuracia, até mesmo com as estratégias do dummy diferentes (most_frequent e stratified). Alguma explicação possível pra isso? (Por sinal, parece que nessa aula o professor copia e cola o código, muda o nome do stratified para mostfrequent mas não coloca o "strategy" como parametro no construtor do DummyClassifier)

Código da aula respectiva

3 respostas

Bom dia, João!

Em relação aos 2 exemplos do DummyClassifier ilustrados no print, vejo que um ele utilizou a estrategia "Most Frequent" e na outra utilizou o valor padrão para esse parâmetro, que é o "prior". Observando a documentação do DummyClassifier, vemos que o método predict para os dois DummyClassifiers (um com strategy = 'prior' e um com strategy = 'most_frequent') retornam o mesmo resultado:

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Entendi, mas qual a diferença entre os dois então?

Olá, João

Como descrito na documentação, para o uso do método predict as duas abordagens retornam o mesmo resultado. A diferença entre as 2 estratégias está quando o método predict_proba é utilizado. Ao estimar o vetor de probabilidades (referente às classes) para cada instância, a estratégia most_frequent retorna um vetor de probabilidade equivalente a performar o One-hot enconding. Já a estratégia prior retorna um vetor de probabilidade equivalente a distribuição das classes observadas no treinamento do DummyClassifier, isto é, na distribuição do seu y_train.

Para mais detalhes, sugiro a leitura da documentação do DummyClassifier: https://scikit-learn.org/stable/modules/generated/sklearn.dummy.DummyClassifier.html

Espero ter ajudado