1
resposta

PRINT DO TEXTO MELHORADO

no trecho de código sugerido: texto = pytesseract.image_to_string(imagem, lang = 'por', config = config_tesseract) print(texto)

encontrei o seguinte retorno de erro: AttributeError: 'tuple' object has no attribute 'read' Emesmo com algum tempinho de pesquisa na Web não consegui solucuonar de tal forma que o código rodasse.

Poderiam me ajudar? Colo a seguir o print do erro no Colab

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

1 resposta

Bom dia Ananda.

Você conseguiu rodar com sucesso todos os passos anteriores de configuração? Por exemplo:

1) !sudo apt install tesseract-ocr

2) !pip install pytesseract

3) reiniciar o ambiente

4) !mkdir tessdata

5) !wget -O ./tessdata/por.traineddata https://github.com/tesseract-ocr/tessdata/blob/main/por.traineddata?raw=true

6) import cv2

7) import pytesseract

8) Transferir a imagem "trecho_livro.png" para a pasta /content

9) config_tesseract = '--tessdata-dir tessdata --psm 6'

O erro que você mostrou aqui, parece ser por falta de algum desses passos.