Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Dúvida] Sobre os parâmetros

Estou com dúvida de quais parâmetros utilizar no RandomForestClassifier(Ex: max_depth=10, n_estimators=200, min_samples_split=2) ou no DecisionTreeClassifier. Eu fiz uma pesquisa e comecei a utilizar o GridSearchCV, é uma boa pratica utilizar o GridSearchCV ou tem uma forma mais eficiente de descobrir quais parâmetros utilizar ?

1 resposta
solução!

Ei! Tudo bem, Jean?

Escolher parâmetros na mão para modelos como RandomForestClassifier e DecisionTreeClassifier realmente não é tão simples, então você está no caminho certo usando o GridSearchCV. Ele é, sim, uma boa prática porque garante uma busca estruturada pelas melhores combinações.

Mas existem formas mais eficientes dependendo do cenário:

Quando o GridSearchCV é bom:

  • Cenário em que o conjunto de parâmetros é pequeno.
  • Quando você deseja testar combinações específicas e totalmente controladas.

Quando pode ficar lento:

  • A performance degrada conforme aumenta o número de parâmetros ou combinações.

  • O processo fica pesado em datasets grandes, já que cada treino demanda mais tempo.

Alternativas também eficientes:

  • RandomizedSearchCV: testa combinações aleatórias. Costuma encontrar bons parâmetros muito mais rápido.

  • Bayesian Optimization (ex: Optuna, Hyperopt): busca inteligente, aprendendo a cada iteração. Encontra parâmetros ótimos com menos tentativas.

  • HalvingGridSearch / HalvingRandomSearch: versões mais rápidas do scikit-learn que descartam combinações ruins logo no início.

Espero ter ajudado e qualquer dúvida, compartilhe no fórum.

Até mais!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado!