Erro na aula 3 Atividade 2, retirar acentos das stopwords

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

por Nicholas

| 96.5k xp | 1 posts

Ao rodar a tokenização, com a a coluna de tratamento_3, voce não utiliza a lista com as stopwords sem acentuação, mas a padrão das aulas anteriores. Acredito que deveria ser usado as stopwords_sem_acento.

1 resposta

por Igor Nascimento Alves

| 497.9k xp | 708 posts

Instrutor Engenheiro de dados

25/05/2020

Olá Nicholas.

Você está correto. Na aula 3 atividade 2 (04:13) ele cria o stopwords_sem_acento e na aula 4 atividade 3 (00:59) quando ele vai aplicar o novo tratamento ele utiliza o pontuacao_stopwords.

No tempo 03:26 na aula 3 atividade 2 ele explica que ele aplica o unidecode() nos stop words para o caso de ter acontecido de algum erro de digitação na resenha, por exemplo um não sem acento e dessa maneira não o teríamos removido.

Acredito que não temos muita perda nos resultados por esse engano, mas obrigado pelo aviso, vamos sinalizar isso nas aulas.

Bons Estudos.

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP