Se estou utilizando os mesmos dados, as mesmas bibliotecas e a mesma codificação, por que os valores são diferentes?
Eis o meu código:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn import tree
from sklearn.model_selection import train_test_split
filmes = pd.read_csv("C:\\Temp\\movies_multilinear_reg.csv")
filmes_caract = filmes[filmes.columns[2:17]]
filmes_labels = filmes[filmes.columns[17:]]
treino, teste, treino_labels, teste_labels = train_test_split(filmes_caract, filmes_labels)
treino = np.array(treino).reshape(len(treino), 15)
teste = np.array(teste).reshape(len(teste), 15)
treino_labels = np.array(treino_labels).reshape(len(treino_labels), 1)
teste_labels = np.array(teste_labels).reshape(len(teste_labels), 1)
modelo = tree.DecisionTreeRegressor()
modelo.fit(treino, treino_labels)
modelo.score(treino, treino_labels) = 1.0
modelo.score(teste, teste_labels)
Na aula = 0.65350569565765548 Na minha máquina = 0.6380075817425759