2016-10-19 5 views
1

Я запускаю python 2.6.6 и хочу установить пакет pytesseract. После извлечения и установки я могу вызвать pytesseract из командной строки. Однако я хочу запустить tesseract внутри python. У меня есть следующий код (ocr.py):Запуск образца кода в pytesseract

try: 
    import Image 
except ImportError: 
    from PIL import Image 
import pytesseract 
print(pytesseract.image_to_string(Image.open('test.png'))) 
print(pytesseract.image_to_string(Image.open('test-european.jpg'),lang='fra')) 

Когда я запускаю код на питон ocr.py, я получаю следующий результат:

Traceback (most recent call last): 
    File "ocr.py", line 6, in <module> 
    print(pytesseract.image_to_string(Image.open('test.png'))) 
    File "/pytesseract-0.1.6/build/lib/pytesseract/pytesseract.py", line 164, in image_to_string 
    raise TesseractError(status, errors) 
pytesseract.TesseractError: (2, 'Usage: python tesseract.py [-l language] input_file') 

test.png и тест-европейский. jpg находятся в рабочем каталоге. Может ли кто-нибудь помочь мне запустить этот код? Я попытался следующий:

  1. Изменено tesseract_cmd к «pytesseract»
  2. установлен тессеракт-
  3. OCR

Любой помощь ценится, как я пытаюсь решить эту проблему в течение нескольких часов в настоящее время.

+0

Работает ли 'tesseract test.png stdout'? – wrwrwr

ответ

1

tesseract_cmd должен указывать на программу командной строки tesseract, а не pytesseract.

Например, на Ubuntu вы можете установить программу с помощью:

sudo apt install tesseract-ocr 

А затем установить переменную только tesseract или /usr/bin/tesseract.

+0

Спасибо за ответ. В моем случае это было в '/ usr/local/bin/tesseract' – user6046209