1
resposta

Classificação binária

Olá,

Todos os casos do curso para a classificação foi utilizada uma classificação binária. Caso eu queira classificar um determinado dado e tenha multiplas categorias, como seria o processo de trabalho? Teria que avaliar individualmente a classificação para cada categoria? Ou existe uma forma de se trabalhar com a classificação múltipla?

1 resposta

Oii Vladimir, tudo bem?

Ótima pergunta! Em Machine Learning, quando lidamos com múltiplas categorias, estamos falando de um problema de classificação multiclasse. Felizmente, o scikit-learn (SKLearn) oferece suporte robusto para esse tipo de tarefa.

Existem duas abordagens principais que você pode usar:

  1. One-vs-Rest (OvR) ou One-vs-All (OvA):

    • Essa abordagem envolve a criação de um classificador binário para cada categoria. Cada classificador aprende a distinguir uma categoria específica contra todas as outras.
    • Por exemplo, se você tiver três categorias A, B e C, você criaria três classificadores: um para A vs (B, C), outro para B vs (A, C) e outro para C vs (A, B).
    • No SKLearn, muitos classificadores binários suportam nativamente a classificação multiclasse usando OvR.
  2. One-vs-One (OvO): - Nessa abordagem, você cria um classificador binário para cada par de categorias. Para n categorias, você teria n(n-1)/2 classificadores. - Por exemplo, com três categorias A, B e C, você criaria classificadores para A vs B, A vs C e B vs C. - O SKLearn também suporta esta abordagem.

    Além dessas abordagens, muitos algoritmos de classificação, como Árvores de Decisão, Random Forests e Redes Neurais, suportam nativamente a classificação multiclasse sem a necessidade de técnicas adicionais.

Um abraço e bons estudos.