Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Erro de resolução ao rodar image_to_osd

Ao tentar rodar o código da aula, o seguinte erro ocorreu:

pytesseract.pytesseract.TesseractError: (1, 'Estimating resolution as 127 UZN file C:\\Users\\Main\\AppData\\Local\\Temp\\tess___jud28x loaded. Warning. Invalid resolution 0 dpi. Using 70 instead. Too few characters. Skipping this page Error during processing.') 

Estou rodando o código no windows e não no collab. Outras funções como image_to_string funcionam normalmente. O mesmo erro ocorre para as outras imagens. Issue fechado mas ainda em discussão no github; https://github.com/tesseract-ocr/tesseract/issues/1702

1 resposta
solução!

A solução (leia-se gambiarra) encontrada foi passar o endereço da imagem diretamente como argumento do image_to_osd, conforme recomendado neste post.

print(pytesseract.image_to_osd(r'text-recognize\Imagens\Aula2-livro.png'))

Aparentemente, o tesseract não está reconhendo a informação metadata do PIL (ou o OpenCV, mesmo erro), visto que img.info['dpi'][0] retorna corretamente o valor.