Continuação da resolução do capítulo anterior de Transformação de Dados:
from sklearn.model_selection import train_test_split
X_treino, X_teste, y_treino, y_teste = train_test_split(X, y, stratify=y, random_state=10)
from sklearn.dummy import DummyClassifier
dummy = DummyClassifier()
dummy.fit(X_treino, y_treino)
dummy.score(X_teste, y_teste)
from sklearn.tree import DecisionTreeClassifier
dtc = DecisionTreeClassifier(max_depth=4, random_state=10)
dtc.fit(X_treino, y_treino)
print(dtc.score(X_teste, y_teste))
from sklearn.tree import plot_tree
import matplotlib.pyplot as plt
colunas = [
'pais_Alemanha',
'pais_Espanha',
'pais_França',
'sexo_biologico',
'score_credito',
'idade',
'anos_de_cliente',
'saldo',
'servicos_adquiridos',
'tem_cartao_credito',
'membro_ativo',
'salario_estimado']
plt.figure(figsize=(15,6))
plot_tree(dtc, filled=True, class_names=['nao', 'sim'], fontsize=7, feature_names=colunas);