Pessoal estava acompanhando a aula e fazendo o código junto com o professor e o resultado do meu gráfico foi completamente diferente do professor e fiquei com dúvida se o comportamento de análise do modelo varia normalmente ou se fiz algo errado.
Pessoal estava acompanhando a aula e fazendo o código junto com o professor e o resultado do meu gráfico foi completamente diferente do professor e fiquei com dúvida se o comportamento de análise do modelo varia normalmente ou se fiz algo errado.
Ei, Ygor! Tudo bem?
Agradeço por aguardar o nosso retorno.
Não se preocupe, está tudo certo. Depois de alguns testes, vimos que o problema está na versão da biblioteca sklearn-learn
.
Diferenças entre versões de bibliotecas, como esta, podem alterar comportamento de algoritmos de otimização por causa dos ajustes automáticos baseados nas características dos dados. Acaba modificando coeficientes do modelo, impactando a curva de decisão e métricas como acurácia, mesmo sendo a mesma base de dados e códigos.
Para resolver esse ponto, execute o código para imprimir qual é a versão do seu sklearn-learn
, o meu aqui deu a versão 1.6.
import sklearn
print(sklearn.__version__)
Depois, instale uma versão anterior para podermos chegar no gráfico correspondente:
!pip install scikit-learn==1.3.2
Reinicie o notebook indo no menu superior, clique em Ambiente de execução > Reiniciar sessão e executar tudo.
Pronto, agora vamos adicionar o parâmetro test_size=0.25
no train_test_split
para garantir que 25% dos dados sejam usados para teste e 75% para treino. Sem esse parâmetro a divisão dos dados pode variar, afetando os resultados.
treino_x, teste_x, treino_y, teste_y = train_test_split(x, y,
random_state = SEED,
test_size = 0.25,
stratify = y)
Reinicie o notebook indo ao menu superior, clique em Ambiente de execução > Reiniciar sessão e executar tudo.
Aqui está o notebook usado para o teste caso queira conferir.
Espero ter ajudado e que dê certinho. Qualquer dúvida, conte conosco.
Até mais, Ygor!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado!