como utilizar removedor de sufixos da lingua inglesa

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

por Henrique Noronha Favorette

| 170.3k xp | 16 posts

Olá, vi na aula voce removendo sufixo da lingua portuguesa, mas se eu tenho um dataset em ingles, como faço pra remover o sufixo das palavras de lingua inglesa?

1 resposta

por Igor Nascimento Alves

| 497.9k xp | 708 posts

Instrutor Engenheiro de dados

12/11/2021

Olá Henrique, tudo bem ?

Desculpa pela demora no retorno.

A NLTK tem algumas opções algoritmos para aplicar stemização em diversos idiomas documentação.

Vou deixar aqui o exemplo com o SnowballStemmer, onde devemos informar o idioma que gostaríamos de trabalhar.

import nltk
sno = nltk.stem.SnowballStemmer('english')
sno.stem('grows')
'grow'

Recomendo também a leitura do artigo Lemmatization vs. stemming: quando usar cada uma? para conhecer outras técnicas.

Espero ter ajudado, mas qualquer duvida não hesite em perguntar.

Bons Estudos.

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP