2016-10-12 6 views
0

Я хочу, чтобы извлечь данные из сгустка таблиц, хранящихся в виде изображений -Не удалось установить Qhull при импорте Tesseract в питона

При импорте Tesseract он запрашивает установку Qhull (согласно документации http://pytesseract.readthedocs.io/en/latest/tutorials.html)

код -

> import Image 
> from tesseract import image_to_string 
> print image_to_string(Image.open('test.png')) print 
> image_to_string(Image.open('test-english.jpg'), lang='eng') 

Я получаю следующее ПРОМТ, но я не могу ввести каталог правильно -

Please enter the path to an existing directory where qhull should be installed: 

Я попытался дать каталог в кавычках, а также через переменные, но он продолжает давать мне недопустимые списочный

Это должно быть довольно прямо вперед, но я просто не получаю его.

Заранее спасибо.

ответ

0

использование pytesseract вместо

pip install pytesseract 
0
You Need to change some lines of codes in 
C:\Python27\Lib\site-packages\tesseract\voro.py file 

in line after 

    # Qhull installation 
    if config_parser.has_option('qhull','install-dir'): 
     _qhulldir = config_parser.get('qhull','install-dir').strip() 
    else: 
    # Ask user for qhull directory 
## qstr = 'Please enter the path to an existing directory where qhull should be installed: 
     qstr = 'C:/Python27/Lib/site-packages/tesseract' 
    ## _qhulldir = os.path.expanduser(raw_input(qstr).strip()) 
     _qhulldir = os.path.expanduser(qstr) 
+1

Пожалуйста, попробуйте также объяснить ответ и читать [Как написать хороший ответ] (https://stackoverflow.com/help/how-to-answer) – LazerBanana