Eu estou usando oversampling para nas amostras, então percebi que isso que estava dando divergência no intervalo de confiança na predição de novos dados, então, para corrigir, estou treinando o modelo com o upsampling dentro do pipeline usando make_pipeline do imblearn:
from imblearn.pipeline import make_pipeline
pelo o que pesquisei, fazer isso traz uma visão otimista demais para o modelo; para quem se interessar eu peguei o conteúdo desse link: https://kiwidamien.github.io/how-to-do-cross-validation-when-upsampling-data.html
Se alguém tiver mais conhecimentos sobre isso e quiser compartilhar... :)