A resposta do exercício sugere que uma diferença, independente da direção, representa overfitting. Isso está certo? Independente, como eu identifico o overfitting e também o underfitting?
Obrigado!
A resposta do exercício sugere que uma diferença, independente da direção, representa overfitting. Isso está certo? Independente, como eu identifico o overfitting e também o underfitting?
Obrigado!
Não, uma diferença (independente da direção) nos coeficientes não significa automaticamente overfitting. Uma dica bem legal, pra você entender o overfitting, é ter na mente que ele acontece quando o modelo aprende demais os detalhes (incluindo o ruído) dos dados de treinamento, mas acaba ficando muito complexo e funcionando mal em novos dados.
O sintoma mais claro do overfitting não é o sinal ou a magnitude dos coeficientes, mas a diferença de desempenho entre os dados de treino e os dados de teste. Por exemplo: R² muito alto no treino e muito baixo no teste.
Já o underfitting, acontece quando o modelo é simples demais e não consegue capturar os padrões reais dos dados. Ele falha tanto nos dados de treino quanto nos de teste. Isso porque o modelo tem poucos parâmetros ou não está adequado ao problema.
Resumindo isso tudo, deixo essa tabela de comparação pra ti:
Característica | Overfitting | Underfitting |
---|---|---|
Complexidade | Muito alta | Muito baixa |
Desempenho no treino | Muito bom | Ruim |
Desempenho no teste | Ruim | Ruim |
Causa | Modelo complexo, muitas variáveis, ajusta o ruído | Modelo simples, não captura os padrões reais |
É isso... Espero que eu tenha ajudado a esclarecer melhor a diferença entre Overfitting e Underfitting.
Sugestão de conteúdo para você mergulhar ainda mais sobre o tema:
Conte com o fórum, abraço e bons estudos!