2015-01-23 4 views
0

Я хочу использовать tesseract-ocr lib с python-3.4. Я загружаю tesseract с помощью «sudo apt-get install tesseract-ocr», и теперь я могу использовать его в командной строке. Но я хочу использовать его с python3. Но я не смог найти учебник для использования родного tesseract с python3x.Ошибка установки модуля Tesseract-OCR для Python3x

На самом деле я попытался использовать обертку, такую ​​как pytesseract. Я загружаю с https://code.google.com/p/python-tesseract/wiki/Python3Tesseract и устанавливаю его с помощью dpkg. Я попытался импортировать его, но я получаю странную ошибку.

Сообщение об ошибке;
"ImportError: /usr/lib/python3/dist-packages/_tesseract.cpython-34m-x86_64-linux-gnu.so не определено символ: _Z11GetUTF8TextPN9tesseract11TessBaseAPIE"

Я попытался tesserPy обертку для python3x. Он работает хорошо для турецкого, английского, но не работает для арабского. (Я тестировал tesserpy только для этих языков.) Вы можете получить tesserpy с этого адреса; https://github.com/blindsightcorp/tesserpy

и вот мое сообщение об ошибке, пока я запускаю tesserpy для арабского языка;

tessdata_manager.SeekToStart (TESSDATA_INTTEMP): Ошибка: Ошибка в: в файле adaptmatch.cpp, строка 511

ли кто-нибудь увидеть этот вид сообщения об ошибке раньше?

Заранее спасибо

ответ

0

отредактировать мой вопрос сегодня, и я сказал, что я мог бы сделать с tesserpy OCR для английского и турецкого языка. Скорее всего, tesserpy работает для всего языка. Но у меня все еще была проблема. Я не мог запустить tesserpy для арабских скриптов. Поэтому я продолжал искать и находил пирока. Он также работает с арабскими скриптами. Вы можете клонировать и легко использовать его из git;

PyOcr github repository

Я надеюсь, что этот вопрос может направить кого-то.

 Смежные вопросы

  • Нет связанных вопросов^_^