2013-06-23 3 views
1

Я сделал OCR application для handwritten normal characters. Для сегментации символов я использовал histogram profile method. Это успешно работает для обычных английских символов.Сегментация курсивного символа в OCR

Я использовал горизонтальную проекцию для сегментации линии и вертикальной проекции для сегментации символов.

Чтобы сегментировать строки ручного письменного текста, я могу использовать горизонтальную проекцию как предыдущую. Но я не могу использовать одну и ту же методологию для сегментации английского языка, поскольку они объединены друг с другом, а также наклонены. Может кто-нибудь, пожалуйста, помогите мне с тем, чтобы сегментировать быстрые символы.

+0

Я могу смутно помнить об этом .. как насчет того, если вы повернете буквы так, чтобы они были вертикальными, а базовая линия диагональна? –

+0

приблизительно сегментный, а затем распознает его, если он не распознается, попытайтесь настроить его сегментацию, и так далее. – dervish

ответ

2

Это трудная проблема для решения из-за изменчивости между писателями и символами. Один из вариантов, достигающий до 83% точности, заключается в анализе лигатур (связей между символами) в столбцах записи и рисования на изображении с использованием этих лигатур в качестве базовой точки. В 2013 году Computeria Computer Science предложила этот подход и опубликовала свои исследования по этой конкретной проблеме: https://ac.els-cdn.com/S1877050913001464/1-s2.0-S1877050913001464-main.pdf?_tid=5f55eac2-0077-11e8-9d79-00000aacb35f&acdnat=1516737513_c5b6e8cb8184f69b2d10f84cd4975d56

Другой подход к попытке называется скелетным анализом, который принимает слово в целом и соответствует его форме с другими известными формами слов и предсказывает слово на основе всего изображения.

Удачи вам!