Я работаю на библиотеку Тессеракт и ниже является входом для Tesseract,улучшения тессеракт и изображения предварительной обработки шаги
На начальном этапе реализации я использовал только «МСЗ» зона удостоверения личности. Но фактическое намерение состоит в том, чтобы отсканировать весь документ и получить все тексты в удостоверении личности.
Я прошел через this document и для улучшения качества Tesseract на первом этапе изображение должно быть 300 dpi.
1) Как конвертировать захваченное изображение камеры в формате ios до 300 dpi?
2) Каким должен быть лучший уровень контрастности и яркости для Tesseract для получения наилучших результатов?
3) Есть ли какой-либо другой этап предварительной обработки, который я могу применить к изображению, чтобы получить хорошую точность?
4) Для лучшей точности, каково рекомендуемое разрешение изображения?
5) Я использовал "int tesseract::TESSDLL_API::MeanTextConf"
, чтобы получить оценку доверия. С учетом этого показателя доверия для каждого персонажа есть вероятность, что я могу решить, превышает ли показатель доверия какой-то процент, то признанный персонаж является точным? Если я ошибаюсь, можете ли вы объяснить использование метода «MeanTextConf»?
У вас был большой успех Tessact для обработки изображений из документов ID, таких как ваш образец? – jb007
Hi, Невозможно управлять DPI, если конечный пользователь использует камеру. Проверьте информацию DPI здесь: http://en.wikipedia.org/wiki/DPI Однако это не означает, что вы не можете получить хорошие результаты OCR. После того, как пользователь поставляет изображение, вы можете выполнить автоматическую контрастность и удаление шума, чтобы улучшить качество изображения, прежде чем подавать изображение на двигатель OCR. Изображение, которое вы приложили, имеет хорошее качество, я могу получить часть MRZ, узнаваемую с помощью нашего коммерческого пакета [Asprise OCR SDK] (http://asprise.com/royalty-free-library/ocr-api- for-java-csharp-vb.net.html) –
' ' –