Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Eu não entendi o propósito dos Resíduos.

Eu entendi como se calcula, mas não consegui compreender o motivo de calcular ele, para que ele serve, para que vou usar ele.

1 resposta
solução!

Bom dia. Quando estamos falando de regressão linear, utilizamos o termo "resíduos" para diferenças nos valores de origem "aleatória", tendo em vista que na vida real inúmeros fatores podem determinar o valor da nossa variável target. Ou seja, o modelo desenhado dentro da regressão linear não conseguiu compreender somente com as variáveis informadas o que ocasionou com que alguns valores fiquem acima ou abaixo da curva/reta.

Contudo, sempre devemos considerar os resíduos na hora de treinar e testar nossos modelos, isso porque eles por mais que sejam comuns, podem indicar que algo está errado. Por exemplo, se na hora de modelar os resíduos eles sempre forem negativos, isso pode indicar que o modelo está sempre fazendo predições maiores do que o valor real (ou vice-versa). Outro ponto importante é verificar se os resíduos não estão centrados em um ponto distante da origem.

Além disso, é importante cerificar se os resíduos não possuem um "padrão" invés de uma distribuição aparentemente aleatória. Isso porque se existir um padrão (reta, por exemplo), pode indicar que alguma variável importante não está sendo considerada dentro do modelo ou que o tipo do modelo não é adequado.

Outra utilidade da análise dos resíduos é auxiliar na detecção de outliers.

Para te ajudar a estudar melhor sobre o assunto, encontrei esse link: https://www.qualtrics.com/support/stats-iq/analyses/regression-guides/interpreting-residual-plots-improve-regression/

Espero ter ajudado. Estou disponível para eventuais dúvidas.