Não entendi esta explicação, como ficaria o modelo final com o código treinando com todos os dados? Ficaria desta maneira abaixo?
np.random.seed(SEED)
cv = GroupKFold(n_splits = 10)
modelo = SVC()
pipeline = Pipeline([('transformacao', scaler), ('estimador', modelo)])
results = cross_validate(pipeline, x_azar_escalado, y_azar, cv = cv, groups = dados.modelo)
imprime_resultados(results)
modelo.fit(x_azar_escalado, y_azar)
previsoes = modelo.predict(teste_x_escalado)
acuracia = accuracy_score(teste_y, previsoes) * 100
print("A acurácia do SVC com as escalas Reescaladas foi de %.2f%%" % acuracia)