Boas Ramon! Tudo bem? Espero quesim.
Desculpe a demora em responder.
Excelente dúvida a sua. Vou tentar ser o mais breve em explicar porque utilizamos os dados de teste e não de treino para calcular o resíduo.
Para calcular o resíduo, realizamos os seguintes passos:
- Realizar previsões do Modelo
- Comparar o quanto essas previsões se aproximam do y real
Entretanto, como o nosso modelo foi treinado com os dados de teste, o nível de assertividade para esses mesmos dados, quando realizamos o passo 1 (previsões) será muito mais alto, mas não necessiariamente vai refletir a acurácia do modelo.
Em outras palavras, pode-se dizer que o não utilizamos os dados de treino após o modelo estar ajustado pois ele fica viciado aos dados com que foi treinado.
Espero ter ajudado!
Bons estudos!