Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Dúvida] Não tem problema fazer um fit novamente em um modelo já treinado?

Olá.

Nesta atividade, foi aplicado o GridSearchCV e utilizado o best_estimator_ para pegar o melhor modelo com os hiperparâmetros otimizados. Isso foi atribuído a uma variável modelo, que depois foi treinada com os dados de treino que possui somente as features selecionadas:

modelo = grid_search.best_estimator_
modelo.fit(X_treino_selecionado,y_treino)

Estou supondo que o best_estimator_ é um modelo que já foi treinado (já teve um fit executado durante o grid search). Então, ao fazer modelo.fit(), estamos fazendo um segundo fit no modelo, correto? Não tem problema fazer isso? O modelo é sobrescrito? Não há risco de o treinamento anterior "vazar" para o novo treinamento?

Obrigado!

1 resposta
solução!

Olá, Matheus, tudo bem?

Sim, ao utilizar grid_search.best_estimator_, você está pegando o modelo que já foi treinado durante o GridSearchCV.

Portanto, ao fazer modelo.fit(X_treino_selecionado, y_treino), estamos, sim, treinando novamente o modelo, mas agora com os dados de treino selecionados. Não há problema em fazer isso, pois o best_estimator_ cria uma nova instância do modelo com os melhores hiperparâmetros, portanto, não há risco de vazamento de treinamento anterior.

Portanto, ao chamar modelo.fit() novamente, você está treinando um novo modelo com os dados de treino selecionados. Espero ter esclarecido.

Caso surja alguma dúvida, fico à disposição.

Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!