2012-04-05 1 views
27

Я пробовал Tesseract с iPhone и оценил его точность на 70% без предварительной обработки изображения. Я также заметил, что это может быть плохой при извлечении цифр. Я слышал об OCR-модуле OCRopus: лучше, Tesseract или OCRopus, с точки зрения извлечения цифр и если моя предварительная обработка изображения низкая?
Кто-нибудь запускает тесты с использованием обоих двигателей, сравнивая результаты с использованием обычных показателей?Какой OCR Engine лучше: Tesseract или OCRopus?

+15

Я не понимаю, почему этот вопрос закрыт. Двигатели OCR можно сравнивать друг с другом для точности - это очень объективное сравнение. Не так много «основанных на опциях». –

ответ

28

Первоначально OCRopus фактически использовал Tesseract в качестве механизма распознавания внутри, но позже они изменили его на свой совершенно новый движок. Он все еще свежий и не зрелый. Мы сравнивали точность сравнения год назад, и OCRopus определенно проигрывал Tesseract, я даже не говорю о коммерческих правах. С тех пор я остановился после прогресса OCRopus, но то, что я определенно знаю, что активность на форуме поддержки OCRopus близка к нулю. Это означает, что никто его не использует. В основном люди используют коммерческие двигатели, но если цена является проблемой для них, и они могут терпеть более низкую точность, то они используют Tesseract. Это, безусловно, лучший среди Open Source.

+4

Привет, Tomato, если мы хотим использовать коммерческие двигатели, что бы вы порекомендовали? –

+2

ABBYY является лидером на рынке OCR. В зависимости от ваших потребностей и бюджета вы можете выбирать между ABBYY FineReader Engine (http://abbyy.com/ocr_sdk), ABBYY Cloud OCR SDK (http://ocrsdk.com), ABBYY Mobile OCR Engine (http: // www. abbyy.com/mobileocr/) и ABBYY FlexiCapture Engine (http://www.abbyy.com/flexicapture_engine). Я работаю в ABBYY и могу предоставить вам дополнительную информацию, если вам нужно. –