Ei, William! Tudo bem?
Que bom que você está explorando diferentes configurações, parabéns! Quando você aumentou o número de rodadas de 170 para 300 e observou uma diminuição no RMSE, isso indica que o modelo teve mais oportunidades para ajustar seus parâmetros e melhorar a previsão.
Uma dica para não aumentar o risco de overfitting, onde o modelo se ajusta muito bem aos dados de treinamento, mas não generaliza bem para novos dados, é considerar algumas abordagens adicionais:
Utilize a validação cruzada para avaliar o desempenho do modelo de forma mais robusta. Isso ajuda a garantir que o modelo generalize bem para dados não vistos.
Configure o parâmetro early_stopping_rounds para interromper o treinamento se o erro de validação não melhorar após um certo número de rodadas. Isso pode ajudar a evitar o overfitting.
Ajustar outros hiperparâmetros, como max_depth, min_child_weight, e gamma, para ver se você consegue melhorar ainda mais o desempenho sem aumentar muito o número de rodadas.
Monitore o desempenho do modelo tanto nos dados de treinamento quanto nos dados de validação para verificar se há sinais de overfitting.
Continue se dedicando aos estudos e qualquer dúvida, compartilhe conosco.
Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!