1
resposta

GroupKFold

Nesse método do RandomSearch já se passou direto para o teste de hiperparâmetros com KFold, ou seja, sem o validação cruzada com GroupKFold. Fiquei um pouco confusa, nessa questão dos hiperparâmetros não precisamos usar primeiro o GroupKFold (fazendo a primeira validação cruzada) para depois validar o modelo no mundo real com o KFold (aplicar o Nested cross validation)?

1 resposta

No caso ele informa que na parte um de otimização que o GroupKFold possui um problema com o Nested cross validation que precisa ser corrigido mas que ainda não foi (pelo menos até esse momento que estou tentando te ajudar). Por isso ele usa o KFold durante o instanciamento do objeto RandomizedSearchCV e também durante o cross_val_score. Se ele usasse o GroupKFold no instanciamento do objeto RandomizedSearchCV e durante o cross_val_score usasse o KFold ele usaria duas técnicas diferentes e deixaria a validação inconsistente.

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software