1
resposta

Aula 05 Stop Words - removendo o que não agrega | Método alternativo de gerar a coluna

Olá, gostaria de deixar um método em que o processamento é mais rápido e de um modo que faz mais sentido ao usar o pandas:

df['tratamento_1'] = df['text_pt'].apply(lambda linha : ' '.join(palavra for palavra in linha.split() if palavra.lower() not in stop_words) )

Para cada linha é feito um split(), assim podemos usar uma list comprehension para selecionar apenas os itens que não estão nas stop_words, e retornar tudo em uma frase novamente com o ' '.join().

1 resposta

Olá, João! Tudo bom com você?

Utilizar o método .apply() é uma ótima prática ao se trabalhar com DataFrame pandas. Parabéns por sua ideia e por ter conseguido sintetizar o tratamento em bem menos linhas de código.

Pesquisar e implementar outras formas de realizar as funções feitas durante o curso com certeza te ajudará a conhecer mais aplicações.

Obrigado e continue sempre compartilhando com a gente as funções que você desenvolver, vai ajudar mais pessoas a conhecer outras formas também.

Abraços.