Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Dúvida] Homocedasticidade

Porque a Homocedasticidade foi calculada baseada nos dados de treino e não de teste nos cursos que fiz "Data Science: transformando variáveis para uma Regressão Linear". Em ouros cursos verifiquei o mesmo problema. Não deveria ser calculados sobre os dados de teste?

1 resposta
solução!

Olá Vagner, tudo bem?

A homocedasticidade é uma suposição na regressão linear que significa que os erros do modelo têm variância constante ao longo dos valores preditos. Durante o treinamento de um modelo, verificamos essa suposição nos dados de treino porque é com base nesses dados que o modelo é ajustado e otimizado.

Garantir a homocedasticidade nos dados de treino ajuda a confirmar que o modelo está capturando bem a relação entre as variáveis, sem viés nos resíduos. Se ela não for respeitada, isso pode indicar que o modelo não está ajustado corretamente.

Já nos dados de teste, o foco é avaliar o desempenho do modelo em dados novos, usando métricas como RMSE, R² ou MAE, para medir a precisão e o erro. Por isso, a homocedasticidade não costuma ser avaliada no teste, já que o objetivo é verificar como o modelo generaliza.

Espero ter ajudado.

Qualquer dúvida, não hesite em compartilhar no fórum.

Abraços!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado