1
resposta

Validação cruzada

x, x_test, y, y_test = train_test_split (x, y, test_size = 0.15, random_state = 42)

Fiz essa separação nos dados para realizar a validação cruzada do modelo com os conjuntos x e y. Optei por um n_split = 10 na validação cruzada, e a partir dos 10 resultados obtive o valor médio e o intervalo. Com isso, consigo representar os resultados de treino e validação como média (intervalo). Mas ao aplicar o modelo treinado com x e y nos dados de teste reservados eu obtenho um valor unico. A questão é: existe uma maneira adequada de obter o valor do desempenho no teste final em replicatas para fazer o calculo de média e intervalo ? E se isso e válido, pois, na minha percepção, se não houver alterações nos dados de treino ou de teste, o resultado obtido deveria ser sempre o mesmo. Perguntei por que encontrei alguns artigos que reportam os resultados de treino, validação e teste todos como media e intervalo

1 resposta

Oii, Thales! Tudo bem?

Para que eu possa sanar a sua dúvida com mais assertividade, poderia me dizer qual curso e aula se refere ao exemplo que você trouxe, por gentileza? Com isso, consigo ver o contexto para encontrar uma solução.

Conte conosco para te auxiliar, até mais!