3
respostas

Palavras diferentes retornando na mesma busca

Olá, olha eu de novo... Seguinte, tenho um caso específico em que efetuo a minha busca por animais, ela me retorna quase tudo certo, com exceção de que animação vem junto. Gerei o token dessas palavras pelo analyzer e ambas são anim. Existe um jeito de contornar isso? Já tentei com sinônimos e stopwords mas não deram certo, devo estar fazendo da maneira errada ou estou no caminho errado. Existe alguma maneira de atribuir um token a uma palavra ou vice-versa, ou ignorar esse token (acho que não é uma boa), ou alterar, ou qualquer outra coisa? Alguém pode me ajudar? Muito obrigado.

3 respostas

Veja se este é o seu caso:

https://github.com/elastic/elasticsearch/issues/15353

No final ele explicar como fazer para contornar esta situação. Espero ajudar.

Oi Marcelo, obrigado pela resposta, mas acredito que não é meu caso... As palavras continuam retornando anim como token. Já coloquei anim como stopword, mas isso só retira essa palavra da minha busca. Coloquei também as palavras sozinhas sem atribuir nenhum sinônimo (... "animais", "animação" ...), atribui sinônimos (... "animais => animal,animais", "animação => animação,animações" ...) e nada, o retorno do token é anim para as buscas, ele só acrescenta ou diminui certos tokens que atribuo com os sinônimos, mas o token principal anim continua. Na minha visão, eu teria que 'excluir' esse token anim para criar um de acordo com a palavra. Um exemplo do que estou dizendo são as palavras animais, animacao, animaçao, animação, animacoes, animaçoes, animações, ambas geram o mesmo token. Não sei se estou conseguindo passar meu problema...

Ainda não encontrei nada a respeito, alguma ideia?

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software