Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Dúvida] Uso da validação cruzada aninhada

Realmente é necessário usar validação cruzada aninhada em todas as ocasiões (i.e. substituindo absolutamente toda validação cruzada não aninhada, em qualquer ocasião), ou somente quando a necessidade é mais enfática e os prejuízos do data leaking seriam maiores?

Matricule-se agora e aproveite até 50% OFF

O maior desconto do ano para você evoluir com a maior escola de tecnologia

QUERO APROVEITAR
1 resposta
solução!

Tudo bem, Ryann?

Ótima pergunta, obrigada por compartilhar no fórum.

A validação cruzada aninhada não é necessária em todos os casos. Ela é mais indicada quando:

  • Se está fazendo** busca de hiperparâmetros** e quer evitar qualquer risco de data leakage;
  • Precisa de uma estimativa confiável de generalização, geralmente em contextos de pesquisa, competições ou projetos onde a performance precisa ser muito bem comprovada;
  • Trabalha com poucos dados, o que aumenta o risco de overfitting durante o ajuste fino.

Agora, no dia a dia, você não precisa substituir toda validação cruzada normal por uma aninhada. Em muitos projetos práticos, quando você está explorando modelos, comparando alternativas ou iterando rápido, a validação cruzada tradicional funciona super bem.

A nested CV entra como uma camada extra de segurança quando:

  • Você já tem um modelo final competindo com outros;
  • Quer reportar um resultado “limpo” para publicação ou documentação técnica;
  • Está realmente preocupado com otimização fina.

Ou seja: ela serve para os casos em que o impacto do overfitting do tuning seria significativo, e não como padrão obrigatório para tudo.

Estes conteúdos podem abrir em inglês e se preferir ler em português, recomendo que utilize o tradutor automático do navegador.

Espero ter ajudado e qualquer dúvida, compartilhe no fórum.

Até mais!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado!