Alguém poderia me explicar quais são as diferenças entre test x train? Não entendi pq criou duas variáveis y_previsto_train = modelo.predict(X_train) e y_train; quais as diferenças?
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Alguém poderia me explicar quais são as diferenças entre test x train? Não entendi pq criou duas variáveis y_previsto_train = modelo.predict(X_train) e y_train; quais as diferenças?
Olá Igor, tudo bem?
Sobre a sua primeira pergunta, de modo simplificado podemos diferenciar o train do test, a qual no primeiro teremos uma base para treinar o nosso modelo, e no segundo é uma amostra para testar o modelo criado e entender a qualidade e explicabilidade. Há diversas maneiras de separar amostras para treino e testes, é muito comum encontrarmos uma divisão de 70/30, ou seja 70% dos dados para treino e 30% para testes, mas isso depende dos dados e do estudo.
Quanto a sua outra pergunta, em y_previsto_train = modelo.predict(X_train) é executado a previsão dos valores baseada na amostra de treino (X_train), já em y_train temos os verdadeiros valores de Y da amostra treino. Com essa separação podemos comparar os valores previstos e os reais valores de Y.
Espero ter ajudado : )
Obrigado, Ana! Abraços!!