Alguma vantagem ou desvantagem em se usar sempre (ou quase sempre) o StatifiedKFold ? Se as classes forem muito desbalancedas (ex.: detecção de fraude) ou bem homogêneas ? Se a varável de classificação não for binária ele funciona bem??
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Alguma vantagem ou desvantagem em se usar sempre (ou quase sempre) o StatifiedKFold ? Se as classes forem muito desbalancedas (ex.: detecção de fraude) ou bem homogêneas ? Se a varável de classificação não for binária ele funciona bem??
Olá Geraldo.
Interessante seu ponto, busquei pelo seu questionamento e encontrei essa discussão no stackoverflow e esse post de um blog, onde é apontado os problemas que temos em utilizar o kfold em dados desbalanceados.
Entretanto, olhando a documentação do Stratified k-fold, encontramos que é uma das preocupações dele diminuir os problemas de classes desbalanceadas.
Acredito que lendo essas fontes vai poder determinar qual é a melhor abordagem para o seu problema.
Bons Estudos.