2
respostas

Pesquisa em documento pdf

Bom dia Alguém poderia me dar um exemplo de como fazer uma pesquisa em um documento PDF. Tenho uma tabela de clientes no banco e preciso ver se esses clientes aparece em um documento PDF.

2 respostas

Olá,

Uma opção é este plugin: https://www.elastic.co/guide/en/elasticsearch/plugins/current/mapper-attachments.html

Té mais,

Boa tarde,

Preciso fazer pesquisa no arquivo caderno.pdf, e fiz o seguinte:

1) Instalei o logstash

2) Criei o arquivo na pasta bin com nome logstash-simple.conf

input { file { path => "C:\Users\ibrito\Desktop\caderno.pdf" start_position => "beginning" } }

output { elasticsearch{ hosts => "localhost" index => "logstash-pdf" } stdout {codec => "json" } }

3) No kibana executei GET /logstash-pdf/_search { }

e o resultado foi o seguinte:

{ "took": 5, "timed_out": false, "_shards": { "total": 5, "successful": 5, "failed": 0 }, "hits": { "total": 1062, "max_score": 1, "hits": [ { "_index": "logstash-pdf", "_type": "logs", "_id": "AV3v2nf2MutiQRfskyrU", "_score": 1, "_source": { "path": """C:\Users\ibrito\Desktop\caderno.pdf""", "@timestamp": "2017-08-17T11:00:55.346Z", "@version": "1", "host": "IMA010479", "message": "0000080067 00000 n\r" } }, { "_index": "logstash-pdf", "_type": "logs", "_id": "AV3v2ncQMutiQRfskyqh", "_score": 1, "_source": { "path": """C:\Users\ibrito\Desktop\caderno.pdf""", "@timestamp": "2017-08-17T11:00:55.568Z", "@version": "1", "host": "IMA010479", "message": """\x95\xF2\x9E\"\xB1\x97\xFC\xF2`\x95\x80\x85>\xEC?L~\x89Rɞ\u001EO\xF0\xB5h/\u001E\xA1\u001A\x9C.w\x87\xC7\xE3\u0014Pn/.\xEDƆ\"\xC8ݟ\xF3\u001A6\xFB\u000F\xC3&\x96J\xEE\xEE\u001E\xD1\u0016\x81\xF5Q\r\xF6XAD\x8DtD\xB8H/\x99\xA6Zs\xDD\u001EO0\xA8(\xA3F\u0015\u0015\xE5\xE4\xC0\xD3?S\xDD\xC8\xE5tF\xA3\x85\x85F\xA3\xC1P\x80Tԁ^\u0001\u0014\xF4\u0012\x93\xAA\u0017\x86\xB75\xCB7\xC8D>\x8CoG\"\u001E\xA5Z˅)\xC2\r\xC2V\x81\u0017Rb\xCF\xDF\xEA\x8D^!\x9F\xAD\xAD\xEC;\xBB\xA2\u000F\xD22\xF9\xFC\xD5?\xF4\xA6\f""" }

Alguém poderia me ajudar?