Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[OFF] Dúvidas com funcionalidade de indexação

Olá a todos, vou precisar trabalhar com indexação em um projeto que vou iniciar, na verdade o projeto já existe(web -jsf), é um legado, a primeira ideia seria indexar o conteúdo de algumas tabelas que gardam texto(html) e documentos pdf, eu usaria hibernate search para indexar o banco e para indexar os pdfs eu usuaria a pdf box ou tika para extrair o texto e posteriormente gerar o índice.

Consegui gerar o índice, realizar buscas,etc... mas agora vou precisar criar uma nova funcionalidade: o usuário poderá cadastrar duas palavras que tenha interesse, então quando um novo documento inserido no sistema e indexado, se as palavras de interesse de cada usuário estiver no documento, eu devo notificar esse usuário( e não tenho ideia de como implementar isso, se o lucene tem algumaferramenta pra auxiliar nessa questão ou se existe alguma outra ferramenta de machine learning ,ou qualquer outra coisa que eu possa usar para esta tarefa

1 resposta
solução!

Fala Ricardo,

Chegou a dar uma olhada no MemoryIndex do Lucene? Creio que seja o que você esteja precisando: https://lucene.apache.org/core/4_1_0/memory/org/apache/lucene/index/memory/MemoryIndex.html