Alguém poderia me explicar quais são as diferenças entre test x train? Não entendi pq criou duas variáveis y_previsto_train = modelo.predict(X_train) e y_train; quais as diferenças?
Alguém poderia me explicar quais são as diferenças entre test x train? Não entendi pq criou duas variáveis y_previsto_train = modelo.predict(X_train) e y_train; quais as diferenças?
Olá Igor, tudo bem?
Sobre a sua primeira pergunta, de modo simplificado podemos diferenciar o train do test, a qual no primeiro teremos uma base para treinar o nosso modelo, e no segundo é uma amostra para testar o modelo criado e entender a qualidade e explicabilidade. Há diversas maneiras de separar amostras para treino e testes, é muito comum encontrarmos uma divisão de 70/30, ou seja 70% dos dados para treino e 30% para testes, mas isso depende dos dados e do estudo.
Quanto a sua outra pergunta, em y_previsto_train = modelo.predict(X_train)
é executado a previsão dos valores baseada na amostra de treino (X_train
), já em y_train
temos os verdadeiros valores de Y da amostra treino. Com essa separação podemos comparar os valores previstos e os reais valores de Y.
Espero ter ajudado : )
Obrigado, Ana! Abraços!!