0
respostas

[Projeto] Mão na massa: criando uma função para visualizar a frequência de palavras

Nesta atividade, foi criada a função grafico_frequencia, responsável por automatizar a visualização das palavras mais frequentes em uma coluna textual de um DataFrame. A função recebe o DataFrame, o nome da coluna de texto e a quantidade de palavras que devem ser exibidas. Em seguida, todos os textos da coluna são concatenados em uma única string, tokenizados com o WhitespaceTokenizer da biblioteca NLTK e contabilizados por meio do FreqDist. Depois, os resultados são organizados em um novo DataFrame com as colunas Palavra e Frequência, ordenados de forma decrescente e limitados à quantidade informada pelo usuário. Por fim, é gerado um gráfico de barras com a biblioteca seaborn, permitindo visualizar de forma clara quais palavras aparecem com maior frequência no conjunto de avaliações.

Segue o Código: https://github.com/Moquiuti/NLP/blob/main/fun%C3%A7%C3%A3o_para_visualizar_a_frequ%C3%AAncia_de_palavras.ipynb