1
resposta

Importância do baseline - SVMs

from sklearn.dummy import DummyClassifier

dummy_stratified = DummyClassifier()

Boa noite! Estou com dúvida para entender a importância dos classificadores. Pois após a etapa de treino de um modelo (SVM no caso) já ocorre a etapa de testes. A etapa de testes "padrão" (usando o test_x e o test_y) não é suficiente? Os labels de um teste de baseline também são gerados aleatoriamente?

1 resposta

Pelo que entendi, a ideia de usar o baseline pelo dummy é gerar adivinhações aleatoriamente e depois comparar com o resultado obtido pelo seu modelo. Ou seja, se as adivinhações de classe aleatoriamente geradas chegam em um resultado muito próximo do seu modelo (SVM), significa que seu modelo não gera um resultado muito bom. Chama baseline porque é o mínimo que o seu modelo tem que prever em comparação com uma previsão aleatória. O dummy usa várias estratégias para adivinhações aleatórias, Most_frequent por exemplo.

O teste_x e teste_y testa o seu modelo com um uma amostra do seu conjunto total.

Acho que para entender os labels do dummy vale a pena entrar na documentação.

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software