Tem uma parte do texto que diz: "Como acabamos de ver o Bag of Words irá criar uma label para cada palavra do nosso dataset". O que é Bag of Words? Até agora não me lembro de ter visto nas aulas.
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Tem uma parte do texto que diz: "Como acabamos de ver o Bag of Words irá criar uma label para cada palavra do nosso dataset". O que é Bag of Words? Até agora não me lembro de ter visto nas aulas.
Olá Marcos, tudo bem?
Bag-of-words é uma representação simplificada usada no processamento de linguagem natural e na recuperação de informações (IR).
Exemplo:
(1) John gosta de assistir filmes. Mary também gosta de filmes.
(2) John também gosta de assistir jogos de futebol.Com base nesses dois documentos de texto, uma lista é construída da seguinte forma:
[
"John" ,
"gosta" ,
"de" ,
"assistir" ,
"filmes" ,
"Mary" ,
"também" ,
"futebol" ,
"jogos"
]Espero ter esclarecido sua dúvida. Bons estudos e sucesso!
Olá Marcos.
Na aula 2 atividade 3 temos esse video e nele o professor explica teoricamente o que é o bag of words.
Já na aula 2 atividade 4 temos o video onde ele faz o uso da biblioteca CountVectorizer para construir um bag of words.
Uma explicação simples é que o bag of words é uma lista que contem todas as palavras que estão nos textos de maneira não repetida e utilizamos ela no NLP para poder identificar as palavras mais recorrentes e entender se ela agregam algum sentimento.
Exemplo de um Bag of Words:
textos = "Os cursos de NLP da Alura utilizam Bag of Words" e "Aprendi Bag of Words perguntando no fórum da Alura"
| Bag of Words | Os | cursos | de | NLP | da | alura | utilizam | Bag | of | Words | Aprendi | perguntando | no | fórum |
| Texto 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 |
| Texto 2 | 0 | 0 | 0 | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
Bons Estudos.