A instrutora nos mostrou, ao final do curso, que o modelo criado não é confiável para casas mais caras. Minha dúvida seria: qual seria os métodos para corrigirmos o modelo criado?
A instrutora nos mostrou, ao final do curso, que o modelo criado não é confiável para casas mais caras. Minha dúvida seria: qual seria os métodos para corrigirmos o modelo criado?
Olá, Maria, tudo bem?
Quando um modelo apresenta heteroscedasticidade, ou seja, os resíduos não estão distribuídos de forma aleatória ao longo dos valores previstos, isso pode indicar que ele não está capturando bem algumas variações nos preços das casas. Para corrigir ou melhorar a confiabilidade do modelo, especialmente para valores mais altos, algumas abordagens podem ajudar.
Uma possibilidade é transformar as variáveis, como aplicar uma escala logarítmica nos preços das casas, o que pode estabilizar a variância dos resíduos. Outra estratégia é incluir mais variáveis no modelo, já que fatores como localização, idade do imóvel ou características específicas podem influenciar o preço e ainda não estarem sendo considerados. Se a relação entre as variáveis não for linear, pode ser útil testar modelos não-lineares ou adicionar termos quadráticos e cúbicos.
Além disso, técnicas de regularização como Ridge e Lasso podem ajudar a melhorar a generalização do modelo, reduzindo o impacto de variáveis altamente correlacionadas. E, se o modelo atual continuar apresentando problemas, vale a pena experimentar alternativas como árvores de decisão, random forests ou modelos de boosting, que costumam capturar padrões mais complexos.
Espero ter ajudado.
Qualquer dúvida, não hesite em compartilhar no fórum.
Abraços!