2012-01-22 5 views
3

tesseract OCR имеют интерфейс командной строки, который позволяет нам распознавать текст с изображений с некоторыми параметрами.Текстовые блоки определения местоположения и размеров в режиме командной строки в tesseract

Входные argumetns являются ImageName (путь к изображению) outputbase (имя распознанного текста) и -psm pagesegmode параметров.

 
pagesegmode values are: 
0 = Orientation and script detection (OSD) only. 
1 = Automatic page segmentation with OSD. 
2 = Automatic page segmentation, but no OSD, or OCR 
3 = Fully automatic page segmentation, but no OSD. (Default) 
4 = Assume a single column of text of variable sizes. 
5 = Assume a single uniform block of vertically aligned text. 
6 = Assume a single uniform block of text. 
7 = Treat the image as a single text line. 
8 = Treat the image as a single word. 
9 = Treat the image as a single word in a circle. 
10 = Treat the image as a single character. 
-l lang and/or -psm pagesegmode must occur before anyconfigfile. 

Но может ли библиотека записывать позиции и размеры распознанных текстовых блоков в конкретный файл или это внутренняя информация?

ответ

4

Tesseract 3.0x поддерживает команду «hoc», которая создает выходной файл HTML-формата, состоящий из распознанных слов и их координат. Однако у него нет информации о размере/шрифте.

+0

Большое спасибо! Это все, что мне нужно. –

 Смежные вопросы

  • Нет связанных вопросов^_^