1
resposta

Dúvida - Resíduos

Boa noite

Tenho uma dúvida: por qual razão utilizamos os dados de treino para cálculo do resíduo e não os dados de teste? Penso que utilizamos os dados de treino porque serem maiores (quantidade de dados) do que os de teste, mas não tenho certeza.

Obrigado

1 resposta

Boas Ramon! Tudo bem? Espero quesim.

Desculpe a demora em responder.

Excelente dúvida a sua. Vou tentar ser o mais breve em explicar porque utilizamos os dados de teste e não de treino para calcular o resíduo.

Para calcular o resíduo, realizamos os seguintes passos:

  1. Realizar previsões do Modelo
  2. Comparar o quanto essas previsões se aproximam do y real
Entretanto, como o nosso modelo foi treinado com os dados de teste, o nível de assertividade para esses mesmos dados, quando realizamos o passo 1 (previsões) será muito mais alto, mas não necessiariamente vai refletir a acurácia do modelo.

Em outras palavras, pode-se dizer que o não utilizamos os dados de treino após o modelo estar ajustado pois ele fica viciado aos dados com que foi treinado.

Espero ter ajudado! Bons estudos!