Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

duvida sobre o stratifiedKfold

quando ele usou o gridsearch pra achar os melhores hiperparametros do modelo pra depois usar o SelectFromModel o parametro cv ele colocou igual a 5, qual a diferença de disso para criar criar um objeto StratifiedKfold com o n_splits = 5? o SelectFromModel faz uma validação cruzada própria ou esse cv significa outra coisa?

1 resposta
solução!

Olá, Danilo! Sua pergunta é muito interessante e mostra que você está realmente se aprofundando no conteúdo. Vamos lá!

O parâmetro cv no GridSearchCV e a criação de um objeto StratifiedKFold com n_splits=5 são bastante semelhantes. Ambos estão relacionados à validação cruzada, mas a diferença está em como eles são usados e implementados.

Quando você define cv=5 no GridSearchCV, o próprio GridSearchCV irá realizar a validação cruzada estratificada de 5 divisões (Stratified K-Fold cross-validation) automaticamente. Isso significa que ele irá dividir o conjunto de dados em 5 partes, treinar o modelo em 4 delas e testar a performance na parte restante. Este processo é repetido 5 vezes, cada vez com uma parte diferente sendo usada para o teste.

Por outro lado, quando você cria um objeto StratifiedKFold com n_splits=5, você tem mais controle sobre o processo de validação cruzada. Você pode usar este objeto para gerar os índices de treino e teste manualmente e, em seguida, usar estes índices para treinar e testar o modelo. Isso permite um controle mais detalhado sobre a validação cruzada, o que pode ser útil em algumas situações.

Quanto ao SelectFromModel, ele não realiza validação cruzada por si só. Ele é uma técnica de seleção de recursos que funciona com base na importância dos recursos. Ele seleciona os recursos cuja importância é maior ou igual ao limiar fornecido. O parâmetro cv que você mencionou é usado no GridSearchCV para realizar a validação cruzada, não no SelectFromModel.

Espero ter ajudado a esclarecer suas dúvidas. Espero ter ajudado e bons estudos!