Os meus resultados ficaram bem divergentes do que foi apresentado em aula:
https://colab.research.google.com/drive/1gz2bY9tI5UQvzGh1FvcOchZLzK2Kq6Mv?usp=sharing
Os meus resultados ficaram bem divergentes do que foi apresentado em aula:
https://colab.research.google.com/drive/1gz2bY9tI5UQvzGh1FvcOchZLzK2Kq6Mv?usp=sharing
Oi, Letícia! Como vai?
Agradeço por compartilhar seu código com a comunidade Alura.
Com o que você descreveu, seus resultados ficaram diferentes do apresentado em aula, mas isso é comum quando trabalhamos com datasets desbalanceados. O processo de balanceamento pode gerar variações por conta do train_test_split
e da aleatoriedade ao aplicar RandomUnderSampler
ou SMOTE
.
Uma dica interessante para o futuro é testar a reprodutibilidade dos resultados fixando a semente aleatória no modelo. Veja este exemplo:
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
Esse código usa random_state=42
para garantir que a divisão dos dados seja sempre a mesma, ajudando a comparar resultados.