Olá,
Ao acompanhar a aula, me deparei com essa dúvida: não seria mais apropriado utilizar as variaveis X_test e y_test, já que estamos estimando os valores previstos e comparando com os valores dos reais?
Digamos que utilizariamos a parte dos dados que foi separada justamente para testes... Veja:
from sklearn.model_selection import train_test_split
y = dados_hoteis['Preco']
x = dados_hoteis.drop(columns = 'Preco')
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.30, random_state=42)
Neste trecho de codigo foi separado 30% dos dados para testes e outros 70% para treinamento do modelo, certo? Então não seria mais apropriado utilizar o x_test e y_test ?
No caso, se eu estivesse analisando sozinho eu não conseguiria encontrar uma lógica que me fizesse usar o x_train e y_train.
Faz sentido, nao faz?
Um abraço e muito obrigado.