1
resposta

A matriz de confusão do sklearn

A confusion matrix que é disponibilizada pelo sklearn é invertida? Porque quando estudei sobre isso, todos os lugares vinham dessa maneira:

Matriz de confusão onde na primeira posição no canto superior tem os True Positives, à direita os False Negatives, no canto inferior esquerdo os False Positive e à direita os True Negatives

Mas quando executamos o código ele printa:

[[28426 6] [ 12 37]]

Sendo 37 de True Positive, 28426 de True Negative, 6 de False Positive e 12 de False Negative.

É isso mesmo? Não consegui encontrar na documentação do sklearn.

1 resposta

Oi, Gustavo! Tudo bem?

A resposta da sua duvida vai depender do que você considera positivo e negativo. As matrizes de confusão tem valores variados a depender das classes de cada modelo e do objetivo que eles buscam. A figura que você enviou não é um padrão de uma matriz de confusão,, na verdade é apenas um exemplo de interpretação de valores. A forma mais fácil de interpretar a matriz de confusão do modelo é plotando ela com os valores das classes para a comparação.

Podemos plotar uma matriz de confusão no sklearn com o método ConfusionMatrixDisplay:

from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay

ConfusionMatrixDisplay(confusion_matrix=confusion_matrix(y_test, y_pred_arvore_decisao), display_labels=classificador_arvore_decisao.classes_[0]).plot()
plt.grid(False)
plt.show()

A imagem resultante nos mostra o apanhado de respostas corretas (e incorretas) para cada classe, e a partir disso, conseguimos interpretar os valore como negativo ou positivos.

Matriz de confusão mostrando em [0,0] 28430 amostra, [0,1] 13 amostras, [1,0] 2 amostras e em [1,1] 13 amostras

No tópico Como interpretar os dados da matriz de confusão? é mostrada um tipo de interpretação dos valores na matriz de confusão que pode ser interessante a sua análise e serve de boa referência de estudo.

Espero ter te ajudado. Bons estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software