Olá, Rafael! Tudo tranquilo com você?
Você pode checar essa informação de algumas formas, aqui vou apresentar duas delas. Se não for exatamente o que procura nos retorne por aqui, tudo bem?
- 1: Com o método value_counts()
teste_y.value_counts()
Saída:
B 105
M 66
Name: diagnostico, dtype: int64
Como podemos observar a quantidade total de câncer benigno é 105 e de câncer maligno é 66 no teste_y
, que é a variável passada para a realizar a construção da matriz de confusão. Agora vamos voltar a nossa matriz gerada em aula:
Se somarmos os valores da matriz de confusão do eixo Y veremos que na linha 0 soma resulta em 105, que de acordo com nosso .value_counts()
representa o câncer do tipo 'B'. Se somarmos os valores da linha 1 veremos que resulta em 66, que de acordo com o .value_counts()
é o número de câncer do tipo 'M'. Com isso você consegue comprovar que a linha 0 são os câncer 'Benignos' e a linha 1 os câncer classificados como 'Malignos'.
- 2: Utilizando a classe
ConfusionMatrixDisplay:
A outra forma de você verificar isso é mais legal por ser visual e pode ser realizada de acordo com o código abaixo:
from sklearn.metrics import ConfusionMatrixDisplay
ConfusionMatrixDisplay.from_predictions(teste_y, classificador.predict(teste_kbest), labels=teste_y.unique())
plt.grid(False)
Saída:
Dessa forma você consegue visualizar exatamente qual linha representa o câncer benigno (B) e o maligno (M). Para obter esse resultado utilizei o método from_predictions
da classe ConfusionMatrixDisplay
. Você pode está conferindo mais detalhes sobre essa classe na documentação. Essa classe tem o objetivo de permitir a visualização da matriz de confusão sem o uso de bibliotecas externas, como o seaborn.
Espero ter ajudado, mas se ainda persistir alguma dúvida estou sempre à disposição.
:)
Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!