from sklearn.feature_extraction.text import CountVectorizer
texto = ["Assisti um filme ótimo", "Assisti um filme ruim"]
vectorizar = CountVectorizer(lowercase=False)
bag_of_words = vectorizar.fit_transform(texto)
vectorizar.get_feature_names()
bag_of_words
matriz_esparsa = pd.SparseDataframe(bag_of_words,
columns=vectorizar.get_feature_names())