1
resposta

[Desafio]: hora da prática

from sklearn.model_selection import train_test_split
X_treino, X_teste, y_treino, y_teste = train_test_split(X, y, stratify=y, random_state=10)

from sklearn.dummy import DummyClassifier
dummy = DummyClassifier()
dummy.fit(X_treino, y_treino)
dummy.score(X_teste, y_teste)

from sklearn.tree import DecisionTreeClassifier
dtc = DecisionTreeClassifier(max_depth=4, random_state=10)
dtc.fit(X_treino, y_treino)
print(dtc.score(X_teste, y_teste))

from sklearn.tree import plot_tree
import matplotlib.pyplot as plt
colunas = [
'pais_Alemanha',
'pais_Espanha',
'pais_França',
'sexo_biologico',
'score_credito',
'idade',
'anos_de_cliente',
'saldo',
'servicos_adquiridos',
'tem_cartao_credito',
'membro_ativo',
'salario_estimado']

plt.figure(figsize=(15,6))
plot_tree(dtc, filled=True, class_names=['nao', 'sim'], fontsize=7, feature_names=colunas);

1 resposta

Oi Matheus, tudo bem?

Parabéns por encarar o desafio de Machine Learning!

Muito bom ver você usando stratify no train_test_split e comparando com um DummyClassifier. Seu código está bem organizado.

Segue assim, tá no caminho certo!

Bons estudos!

Sucesso

Imagem da comunidade