Olá.
Em cursos anteriores, quando aplicávamos a validação cruzada, era comum enviarmos somente os dados de treinamento para a validação (X_treino e y_treino), de modo a evitar vazamento de dados. Nesta atividade, vi que foi enviado o dataset completo (X e y). Entendi que isso foi feito devido ao tamanho do dataset ser bem pequneo (270 entradas). Caso eu tivesse um dataset maior, com milhares de entradas, eu aplicaria a validação cruzada somente nos dados de treinamento (X_treino e y_treino)? Ou a validação cruzada no XGBoost é assim mesmo: envio o dataset completo?
Obrigado!