Estamos desenvolvendo um buscador online em Pdf's de uma empresa. - Todos os arquivos possuem OCR. - Mais de 10.000 Pdf's. Não sabemos qual biblioteca ou api usar, para realizar a busca.
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Estamos desenvolvendo um buscador online em Pdf's de uma empresa. - Todos os arquivos possuem OCR. - Mais de 10.000 Pdf's. Não sabemos qual biblioteca ou api usar, para realizar a busca.
Fala aí alxnet, blz?
Cara nunca tive a necessidade de fazer isso que você está perguntando.
Mas fazendo algumas buscas achei duas bibliotecas que você pode tentar utilizar.
https://www.npmjs.com/package/pdfreader
https://github.com/mozilla/pdf.js
Espero ter ajudado, e bons estudos!
Alguém ajuda?