1
resposta

Palavras de uma letra

O professor disse na aula que o word cloud desconsidera as palavras de uma só letra, mas as primeiras word clouds que eu gerei todas tinham palavras com uma letra (a, o, e, é). Quando olhei no arquivo do professor, realmente as dele não tinham. Alguém sabe porque?

%matplotlib inline
from wordcloud import WordCloud
odas_palavras = " ".join([texto for texto in resenha.text_pt])
nuvem_palavras = WordCloud(width=800,
                           height=500,
                           max_font_size=110,
                           collocations=False
                          ).generate(todas_palavras)

import matplotlib.pyplot as plt
plt.figure(figsize=(10,7))
plt.imshow(nuvem_palavras, interpolation='bilinear')
plt.axis('off')
1 resposta

Olá Raido, tudo bem? Espero que sim!

Desculpe pela demora em retornar.

Eu não sei o que pode ter ocasionado a divergência, mas dependendo da versão da biblioteca, o funcionamento das funções podem variar considerando os parâmetros padrão da função.

A melhor forma de tratar isso é passando um parâmetro de forma manual para o WordCloud. O parâmetro min_word_length na versão atual (1.8.1) da biblioteca tem como valor padrão o número 0. Isso significa que, caso não seja escrito o parâmetro manualmente, serão consideradas palavras com tamanho mínimo de 0.

Você pode definir esse valor como sendo 2 ou 3, para que palavras com poucos dígitos não sejam incluídos. Dessa forma, para um valor mínimo de caracteres 3, o código deve ser escrito como:

%matplotlib inline
from wordcloud import WordCloud
odas_palavras = " ".join([texto for texto in resenha.text_pt])
nuvem_palavras = WordCloud(width=800,
                           height=500,
                           max_font_size=110,
                           collocations=False,
                           min_word_length = 3
                          ).generate(todas_palavras)

import matplotlib.pyplot as plt
plt.figure(figsize=(10,7))
plt.imshow(nuvem_palavras, interpolation='bilinear')
plt.axis('off')

Você pode encontrar mais informações dos parâmetros na documentação do WordCloud.

Espero que tenha tirado sua dúvida.

Estou à disposição. Bons estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software