def classificar_texto(dados, coluna_avaliacao, coluna_sentimento):
vetorizar = CountVectorizer(lowercase=False, max_features=50)
bag_of_words = vetorizar.fit_transform(coluna_avaliacao)
matriz_esparsa_avaliacoes = pd.DataFrame.sparse.from_spmatrix(bag_of_words, columns=vetorizar.get_feature_names_out())
X_treino, X_teste, y_treino, y_teste = train_test_split(bag_of_words, coluna_sentimento, random_state=4978)
regressao_logistica = LogisticRegression()
regressao_logistica.fit(X_treino, y_treino)
acuracia = regressao_logistica.score(X_teste, y_teste)
return acuracia
classificar_texto(df, df.avaliacao, df.sentimento)