1
resposta

Erro no projeto final

Ao executar o código ele da o erro abaixo, o mais interessante é que da primeira vez ele executou, na segunda vez que fui testar ele deu erro.

for imagem in caminho: # percorre as imagens no caminho
  img = cv2.imread(imagem)
  nome_imagem = os.path.split(imagem)[-1] ## recebe os nomes e diretórios das imagens, quebrados, precisamos apenas do -1 (última posição do diretório)
  nome_divisao = '===================\n' + str(nome_imagem) #divisão + nome da imagem que está sendo vista
  texto_completo = texto_completo + nome_divisao + '\n' # recebe o texto completo + a divisão + /n para pular a linha
  texto = OCR_processa(img, config_tesseract) #passa a imagem que vamos utilizar, no caso em cada imagem
  texto_completo = texto_completo + texto # concatena as duas variáveis
ERRO
TesseractError                            Traceback (most recent call last)
<ipython-input-22-6785db42d085> in <cell line: 1>()
      4   nome_divisao = '===================\n' + str(nome_imagem) #divisão + nome da imagem que está sendo vista
      5   texto_completo = texto_completo + nome_divisao + '\n' # recebe o texto completo + a divisão + /n para pular a linha
----> 6   texto = OCR_processa(img, config_tesseract) #passa a imagem que vamos utilizar, no caso em cada imagem
      7   texto_completo = texto_completo + texto # concatena as duas variáveis

4 frames
/usr/local/lib/python3.10/dist-packages/pytesseract/pytesseract.py in run_tesseract(input_filename, output_filename_base, extension, lang, config, nice, timeout)
    260     with timeout_manager(proc, timeout) as error_string:
    261         if proc.returncode:
--> 262             raise TesseractError(proc.returncode, get_errors(error_string))
    263 
    264 

TesseractError: (1, 'Error opening data file /usr/share/tesseract-ocr/4.00/tessdata/por.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language \'por\' Tesseract couldn\'t load any languages! Could not initialize tesseract.')
1 resposta

Olá, Willi! Tudo bem?

O seu código está certinho! Um aluno sofreu o mesmo problema e a solução foi executar o seguinte código ao definir o config_tesseract:

config_tesseract = '--tessdata-dir /usr/share/tesseract-ocr/4.00/tessdata --psm 6'

Portanto, peço que teste essa configuração.

Após isso, será necessário reiniciar o Notebook, seguindo estes passos:

  1. No menu de ferramentas do Google Colaboratory, clicar em "Ambientes de execução";

  2. Selecionar a opção "Reiniciar sessão e executar tudo".

Para realizar essas etapas, você pode acompanhar a imagem abaixo:

Reiniciar sessão e executar tudo, no Google Colaboratory

Caso o problema persista, fico à disposição.

Espero ter ajudado.

Qualquer dúvida, compartilhe no fórum.

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!