1
resposta

Mão na massa: criando uma função para classificação de sentimentos

def classificar_texto(dados, coluna_avaliacao, coluna_sentimento):
  vetorizar = CountVectorizer(lowercase=False, max_features=50)
  bag_of_words = vetorizar.fit_transform(coluna_avaliacao)
  matriz_esparsa_avaliacoes = pd.DataFrame.sparse.from_spmatrix(bag_of_words, columns=vetorizar.get_feature_names_out())
  X_treino, X_teste, y_treino, y_teste = train_test_split(bag_of_words, coluna_sentimento, random_state=4978)
  regressao_logistica = LogisticRegression()
  regressao_logistica.fit(X_treino, y_treino)
  acuracia = regressao_logistica.score(X_teste, y_teste)
  return acuracia


classificar_texto(df, df.avaliacao, df.sentimento)
1 resposta

Oi, Marcia! Como vai?

Agradeço por compartilhar.

Gostei da forma como você estruturou a função de classificação de sentimentos, principalmente usando o CountVectorizer e a LogisticRegression. É um ótimo caminho para começar a testar modelos simples de NLP. Continue praticando, isso vai fortalecer bastante sua confiança.

Conteúdos relacionados
Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!