1
resposta

Optical Mark Reader (Arquivo .pdf)

Preciso ler um arquivo .pdf e gerar relatórios baseados nos dados obtidos desse arquivo (pdf).

Certa vez, fiz um sistema específico para uma gráfica, que interpretava as respostas dos candidatos de um concurso público. O sistema interpretava as marcações (das respostas) dos alunos e cruzava os dados com o gabarito da prova, gerando um relatório com base nesses dados, etc.

Enfim, acontece que "ler" um .pdf, que contém textos, números, etc.. é algo bem mais complexo.

Qual a melhor maneira de atacar esse tipo de problema? Alguém pode me auxiliar com algum material ou qualquer outra pista... rs

Aguardo!

1 resposta

Fala Wh, tudo bem ?

Então, qual linguagem você está usando pra desenvolver esse sistema onde lê pdf? Há um tempo atrás desenvolvi um sistema em java, por exemplo, e contei com apoio de uma biblioteca bem bacana chamada IText PDF para geração de pdf. Outra biblioteca (java) conhecida também é a PDFBox da Apache, onde podemos ler o conteúdo do arquivo e manipulando suas informações usando a própria biblioteca do Java.

Esse tipo de questão varia de plataforma pra plataforma. Existem também softwares no mercado (remark office omr, por exemplo) que já integram com scanners, e baseados em um determinado laytout de arquivo pdf, conseguem não só ler o conteúdo original do arquivo, como também processar qualquer marcação feita sobre o mesmo.