Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

análise dos resíduos

Eu fiquei com uma dúvida referente à escala dos nossos dados e se isso pode trazer algum viés na análise "Preditos x Resíduos".

Minha dúvida é a seguinte: Se o meu modelo comete um erro de R$ 100 mil ao prever o preço de uma casa de R$ 100 mil, e um erro de R$ 300 mil ao prever o preço de uma casa de R$ 5 milhões, a análise dos resíduos "brutos" (estou assumindo que resíduos = Valor Previsto - Valor Observado) não pode ser enganosa? Já que o erro de R$ 300 mil parece muito maior nessa análise mas, em termos percentuais é bem menor (6%) que o erro de R$ 100 mil na casa mais barata (erro de 100%). Nesse caso, como vocês costumam lidar com essa diferença de escala ao analisar o gráfico de "Preditos x Resíduos"?

Agradeço qualquer ajuda ou sugestão!

2 respostas

Acho que ao ler o tópico posterior a aula eu entendi o porquê de manter a escala, me corrija se eu estiver errado ou incompleto na minha interpretação, mas o gráfico não tinha objetivo de verificar se o modelo é melhor ou pior pra casas mais caras ou mais baratas, mas queria avaliar a homocedasticidade porque o método utilizado para o ajuste do modelo (acredito que mínimos quadrados ou algo similar) pode ser influenciado pela diferença da variancia dos erros (que nesse caso provavelmente é influenciado justamente pela diferença das escalas que mencionei acima).

solução!

Oi Crystyan, tudo certo?

Quando você menciona que um erro de R$ 300 mil em uma casa de R$ 5 milhões pode parecer maior em termos absolutos, mas é menor em termos percentuais, isso realmente pode levar a uma interpretação enganosa se não considerarmos a escala.

A análise dos resíduos "brutos" pode, de fato, ser enganosa se não levarmos em conta a magnitude dos valores previstos. Por isso, é comum que, ao analisar a homocedasticidade, os analistas busquem formas de normalizar ou padronizar os resíduos. Uma abordagem comum é calcular os resíduos em termos percentuais, o que permite uma comparação mais justa entre diferentes escalas de preços.

Além disso, como você mencionou, o objetivo do gráfico de "Preditos x Resíduos" é verificar a homocedasticidade, ou seja, se os resíduos estão distribuídos aleatoriamente em torno de zero, sem formar padrões. A presença de padrões pode indicar que o modelo não está capturando adequadamente a variabilidade dos dados, o que pode ser influenciado pela diferença de escala.

Portanto, sua interpretação está correta! O gráfico não é apenas uma forma de avaliar se o modelo é melhor ou pior para casas mais caras ou mais baratas, mas sim uma ferramenta para verificar se os resíduos estão distribuídos de forma aleatória, o que é essencial para a validade do modelo de regressão linear.

Espero ter esclarecido.

Qualquer dúvida, não hesite em compartilhar no fórum.

Abraços!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado