1
resposta

[Projeto] Faça como eu fiz: aprimorando os resultados com outras técnicas

Utilizei o stemming com o RSLPStemmer, reduzindo as palavras ao seu radical e criando a coluna tratamento_5 a partir da coluna tratamento_4. Em seguida, o modelo foi reavaliado com essa nova versão do texto tratado. Depois, foi aplicada a vetorização com TF-IDF, permitindo que o modelo considerasse não apenas a frequência das palavras, mas também sua relevância dentro do conjunto de avaliações. Também utilizei n-grams com o objetivo de capturar combinações de palavras e preservar parte do contexto textual. O melhor cenário foi avaliado com maior quantidade de features, permitindo uma representação mais rica dos textos. Também foram analisados os pesos da Regressão Logística, identificando os termos mais influentes para os sentimentos positivos e negativos.

Segue o código: https://github.com/Moquiuti/NLP/blob/main/TF_IDF_com_N_Grams_para_an%C3%A1lise_de_sentimentos.ipynb

1 resposta

Olá, Leandro! Como vai?

Agradeço por compartilhar.

Você fez uma boa sequência de testes ao aplicar stemming com RSLPStemmer, depois comparar os resultados com TF-IDF, n-grams e uma quantidade maior de features. Essa análise mostra bem como diferentes técnicas de processamento de texto podem mudar a forma como o modelo interpreta as avaliações.

Seu cuidado em observar também os pesos da Regressão Logística foi muito interessante, porque ajuda a entender quais termos influenciam mais os sentimentos positivos e negativos.

Uma dica é registrar os resultados de cada etapa em uma tabela, comparando métricas como acurácia, precisão e recall, para visualizar com mais clareza qual abordagem trouxe melhor desempenho. Entre stemming, TF-IDF e n-grams, qual técnica você sentiu que mais contribuiu para melhorar os resultados do modelo?

Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!