Quando se tem um dataset de mensagens de texto e se cria um modelo de classificação do texto das mensagens do dataset, fazemos toda a limpeza e vários tratamentos, desse dataset que será usado para treino e teste, excluindo pontuação, stop words, etc., depois quando esse modelo de classificação for usado como base para classificar novos dados, toda a etapa de limpeza e tratamento das mensagens também é feita nas mensagens novas? Como isso funciona?