1
resposta

Dúvida - Resíduos

Boa noite

Tenho uma dúvida: por qual razão utilizamos os dados de treino para cálculo do resíduo e não os dados de teste? Penso que utilizamos os dados de treino porque serem maiores (quantidade de dados) do que os de teste, mas não tenho certeza.

Obrigado

Garanta sua matrícula hoje e ganhe + 2 meses grátis

Continue sua jornada tech com ainda mais tempo para aprender e evoluir

Quero aproveitar agora
1 resposta

Boas Ramon! Tudo bem? Espero quesim.

Desculpe a demora em responder.

Excelente dúvida a sua. Vou tentar ser o mais breve em explicar porque utilizamos os dados de teste e não de treino para calcular o resíduo.

Para calcular o resíduo, realizamos os seguintes passos:

  1. Realizar previsões do Modelo
  2. Comparar o quanto essas previsões se aproximam do y real
Entretanto, como o nosso modelo foi treinado com os dados de teste, o nível de assertividade para esses mesmos dados, quando realizamos o passo 1 (previsões) será muito mais alto, mas não necessiariamente vai refletir a acurácia do modelo.

Em outras palavras, pode-se dizer que o não utilizamos os dados de treino após o modelo estar ajustado pois ele fica viciado aos dados com que foi treinado.

Espero ter ajudado! Bons estudos!