Olá.
Nesta atividade, foi aplicado o GridSearchCV e utilizado o best_estimator_ para pegar o melhor modelo com os hiperparâmetros otimizados. Isso foi atribuído a uma variável modelo
, que depois foi treinada com os dados de treino que possui somente as features selecionadas:
modelo = grid_search.best_estimator_
modelo.fit(X_treino_selecionado,y_treino)
Estou supondo que o best_estimator_ é um modelo que já foi treinado (já teve um fit executado durante o grid search). Então, ao fazer modelo.fit()
, estamos fazendo um segundo fit no modelo, correto? Não tem problema fazer isso? O modelo é sobrescrito? Não há risco de o treinamento anterior "vazar" para o novo treinamento?
Obrigado!