1
resposta

obsevação codigo que não aparece antes

no caso quando você usa config_tesseract = '--tessdata-dir tessdata --psm 6'
texto = pytesseract.image_to_string(img, lang='por', config=config_tesseract)
print(texto) vc utilizaa ese codigo como se tivese feito em uma aula anterior mas vc não fez pode explicar isso por favor ?

ma parte de Undersampling vc copia e cola config_tesseract = '--tessdata-dir tessdata --psm 6'
texto = pytesseract.image_to_string(img, lang='por', config=config_tesseract)
print(texto) mas vc so fez texto = pytesseract.image_to_string(img)
print(texto) mas vc so fez texto = pytesseract.image_to_string(img)
print(texto) acho que flata explicarr isso?

para contextualizar o que falei olha essa imagen
antesInsira aqui a descrição dessa imagem para ajudar na acessibilidade Insira aqui a descrição dessa imagem para ajudar na acessibilidade

depois
Insira aqui a descrição dessa imagem para ajudar na acessibilidade
/home/miguel/Área de trabalho/Captura de tela de 2025-08-28 13-53-55.png

1 resposta

Oi, Miguel! Como vai?

A diferença que você notou no código está relacionada ao uso de configurações adicionais no Tesseract para melhorar o reconhecimento de texto. Vamos entender o que isso significa:

  1. --tessdata-dir tessdata → Diz ao Tesseract onde procurar os arquivos de idioma (por exemplo, o por.traineddata para português). Assim ele sabe qual “vocabulário” usar.
  2. --psm 6 → Define como o Tesseract deve “enxergar” a página. O modo 6 considera que a imagem é um bloco único de texto, o que costuma dar mais acerto quando não há colunas ou formatações estranhas.

Essas opções não são obrigatórias. Na prática, você pode começar com a forma simples:

texto = pytesseract.image_to_string(img)
print(texto)

E, se perceber que o OCR não está reconhecendo bem, aí sim experimentar adicionar as configurações para melhorar o resultado.

Espero ter ajudado.

Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!