Olá Luciano,
pelo que eu entendi, você ficou na dúvida se aplicaria o .fit apenas no tipo de algoritmo (random forest, reg log, decision tree ...) ou na pipeline de uma sequência de outros passos, é isso?
Se essa for sua dúvida, no caso desse problema, unimos todas as transformações dos dados juntamente com o tipo de algoritmo no pipeline para ajustar o modelo, esses passos poderiam ter sido separados, mas de forma conjunta ele facilita etapas posteriores, como a classificação de uma frase que não está na base, uma nova observação.
No caso de uma nova observação, podemos aplicar todos as transformações juntamente com o algoritmo para assim conseguir categorizar obedecendo os processamentos feitos no conjunto de dados treinado.
Espero ter ajudado.
Bons estudos