Pelo que entendi quando aplicamos a vetorização e selecionamos os termos mais relevantes como no caso do TFIDF esses termos ficam na "raiz" do nosso modelo salvo, certo? Minha dúvida é qnt a aplicação em produção, vou aplicar o TF-IDF nos dados de produção antes de olhar para o modelo, e muito provavelmente os termos escolhidos serão outros, inclusive com outros "pesos" para cada termo, existe uma forma de corrigir isso (talvez selecionando apenas os termos do modelo), ou no geral é algo que não tem muita influência visto quem o treino tende a espelhar a base?