2011-01-14 5 views
1

мне нужно сделать что-то подобное этому How to write a bash script that cuts images into pieces using image magick?Image to text conoversion: как обрезать отдельные слова в отдельные файлы?

Но я не»знать заранее, где эти области и их размер: мне нужно, чтобы определить„ящики“, которые содержат каждое слово, а затем обрезать каждый из них и сохранить их в отдельные файлы.

ответ

1

Большинство программ OCR делает что-то вроде этого, поэтому вы можете попробовать посмотреть какой-то исходный код для программы OCR. Много лет назад я провел много времени с кодом для GOCR (http://jocr.sourceforge.net/), который имеет довольно простой подход к реализации этого алгоритма.

Если вы не хотите писать код, я не уверен, что предложить. Но если вы можете найти программное обеспечение, которое разбивает изображения на части на основе пробелов, вы можете попытаться размыть изображение (чтобы сделать текст в blobs), а затем установить пороговые значения и найти соответствующие поля. Непонятно, что результаты были бы очень полезными.