Estou utilizando o método do bag of words para verificar, segundo alguns critérios, se uma frase atende ou não os requisitos. Para isso eu classifiquei manualmente 200 frases e treinei um modelo.
Após este treino eu tento aplicar o modelo a um outro grupo de frases, porém utilizando o método predict em cada frase individualmente. É ai que surge o meu problema:
ValueError: X has 70 features per sample; expecting 1298
Dessa mensagem eu entendo que o meu modelo foi treinado com base em um bag of words que possuía 1298 colunas, e agora a frase que eu estou tentando avaliar gera um bag of words com somente 70 colunas.
Nesse caso, seria possível eu preencher essa matriz gerada com zeros de forma que possa ser aplicado o meu modelo de predição?