2016-08-05 12 views
0

Я пытаюсь использовать pytesseract для OCR (извлечение текста из изображения). Я успешно установлен pytessearct с помощью команды -Импорт pytesseract

pip install pytessearct 

Когда я пытаюсь установить его снова, он ясно говорит -

Requirement already satisfied (use --upgrade to upgrade): 
pytesseract in ./site-packages 

Это означает, что pytessearct успешно установлен. Когда я пытаюсь импортировать этот пакет в моем IPython ноутбук с помощью -

import pytessearct 

Он выдает ошибку -

ImportError: No module named pytesseract 

Почему это происходит?

+0

Является ли это ./site-packages, которые пришли с установкой питона (или) опорный путем из каталога проекта? –

+0

Это тот, который поставляется с установкой Python. – ComplexData

+0

вы можете создать переменную окружения «PYTHONPATH» и полный путь пакетов сайта как значение созданной переменной (PYTHONPATH). –

ответ

1

Чтобы использовать Python-Tesseract - требует питон 2.5+ или питона 3.x - сначала вы должны установить PIL и pytesseract пакеты через пип:

pip install Pillow 
pip install pytesseract 

Затем вы должны загрузить и установить тессеракта OCR:

https://sourceforge.net/projects/tesseract-ocr-alt/?source=typ_redirect

насколько я знаю, это автоматически добавляет его в переменную PATH.

Затем использовать его как таким образом:

import pytesseract 
from PIL import Image 

img = Image.open('Capture.PNG') 
pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe' 
print(pytesseract.image_to_string(img)) 

Я надеюсь, что это помогает :)