Estamos desenvolvendo um buscador online em Pdf's de uma empresa. - Todos os arquivos possuem OCR. - Mais de 10.000 Pdf's. Não sabemos qual biblioteca ou api usar, para realizar a busca.
Estamos desenvolvendo um buscador online em Pdf's de uma empresa. - Todos os arquivos possuem OCR. - Mais de 10.000 Pdf's. Não sabemos qual biblioteca ou api usar, para realizar a busca.
Fala aí alxnet, blz?
Cara nunca tive a necessidade de fazer isso que você está perguntando.
Mas fazendo algumas buscas achei duas bibliotecas que você pode tentar utilizar.
https://www.npmjs.com/package/pdfreader
https://github.com/mozilla/pdf.js
Espero ter ajudado, e bons estudos!
Alguém ajuda?