2
respostas

Como extrair texto de um determinado pdf usando javascript para um sistema de busca?

Estamos desenvolvendo um buscador online em Pdf's de uma empresa. - Todos os arquivos possuem OCR. - Mais de 10.000 Pdf's. Não sabemos qual biblioteca ou api usar, para realizar a busca.

2 respostas

Fala aí alxnet, blz?

Cara nunca tive a necessidade de fazer isso que você está perguntando.

Mas fazendo algumas buscas achei duas bibliotecas que você pode tentar utilizar.

https://www.npmjs.com/package/pdfreader

https://github.com/mozilla/pdf.js

Espero ter ajudado, e bons estudos!

Alguém ajuda?