2016-09-05 10 views
0

Возможно ли получить размер шрифта с изображения с помощью pyocr или Tesseract? Ниже мой код.получить размер шрифта в Python с Tesseract и Pyocr

tools = pyocr.get_available_tools() 
tool = tools[0] 
txt = tool.image_to_string(
     Imagee.open(io.BytesIO(req_image)), 
     lang=lang, 
     builder=pyocr.builders.TextBuilder() 
) 

Здесь я получаю текст из изображения с помощью функции image_to_string. И теперь, мой вопрос, если я могу получить font-size (номер) тоже моего текста.

+0

Попробуйте внесении изменений в свой образец кода, чтобы быть [mcve]. – boardrider

ответ

0

Используя tesserocr, вы можете получить ResultIterator после вызова Recognize на изображении, для которого вы можете вызывать метод WordFontAttributes, чтобы получить необходимую информацию. Подробнее читайте в документации по методу.

import io 
import tesserocr 
from PIL import Image 

with tesserocr.PyTessBaseAPI() as api: 
    image = Image.open(io.BytesIO(req_image)) 
    api.SetImage(image) 
    api.Recognize() # required to get result from the next line 
    iterator = api.GetIterator() 
    print iterator.WordFontAttributes() 

Пример вывода:

{'bold': False, 
'font_id': 283, 
'font_name': u'Times_New_Roman', 
'italic': False, 
'monospace': False, 
'pointsize': 9, 
'serif': True, 
'smallcaps': False, 
'underlined': False}