O código desenvolvido no na última parte da aula é desnecessariamente complicado.
frase_processada = list()
for opiniao in resenha.text_pt:
nova_frase = list()
palavras_texto = token_espaco.tokenize(opiniao)
for palavra in palavras_texto:
if palavra not in palavras_irrelevantes:
nova_frase.append(palavra)
frase_processada.append(' '.join(nova_frase))
resenha["tratamento_1"] = frase_processada
Esse processo todo pode ser substituído por uma única linha de código, utilizando funcionalidades básicas do Python e do Pandas:
resenha["tratamento_1"] = resenha.text_pt.apply(lambda opiniao: " ".join(set(opiniao.split(" "))-set(palavras_irrelevantes)))
Já me deparei com situações parecidas em outros cursos e é, realmente, muito cansativo/desestimulante ver essas soluções sendo mostradas por instrutores (que deveriam ser experts nas tecnologias que ensinam).
Eu não sou nem muito experiente nem super conhecedor do Python e consigo ver esse tipo de melhoria simples. Criar laços, ainda mais aninhados, só atrapalha o desempenho e entendimento do código.
Os materiais utilizados precisam de revisão urgente.