x, x_test, y, y_test = train_test_split (x, y, test_size = 0.15, random_state = 42)
Fiz essa separação nos dados para realizar a validação cruzada do modelo com os conjuntos x e y. Optei por um n_split = 10 na validação cruzada, e a partir dos 10 resultados obtive o valor médio e o intervalo. Com isso, consigo representar os resultados de treino e validação como média (intervalo). Mas ao aplicar o modelo treinado com x e y nos dados de teste reservados eu obtenho um valor unico. A questão é: existe uma maneira adequada de obter o valor do desempenho no teste final em replicatas para fazer o calculo de média e intervalo ? E se isso e válido, pois, na minha percepção, se não houver alterações nos dados de treino ou de teste, o resultado obtido deveria ser sempre o mesmo. Perguntei por que encontrei alguns artigos que reportam os resultados de treino, validação e teste todos como media e intervalo