Я использую Tess4J (обертка JNA вокруг tesseract) и пытаюсь позвонить tess.doOCR(myFile)
в текст OCR из одностраничного PDF-файла.Tess4J - Собственная библиотека (linux-x86-64/libtesseract.so) не найдена в пути ресурса
У меня установлен GhostScript (с использованием yum install ghostscript
), gs -h
работает правильно.
Мое приложение-сервер использует 64-bit JVM
, и у меня есть gsdll64.dll
, и 64-разрядный тессеракт DLL файлы liblept168.dll
и libtesseract302.dll
в пути к классам.
Когда tess.doOCR(myFile)
называется это записывается:
GPL Ghostscript 8.70 (2014-09-22)
Copyright (C) 2014 Artifex Software, Inc. All rights reserved.
This software comes with NO WARRANTY: see the file PUBLIC for details.
Processing pages 1 through 1.
Page 1
Но тогда он просто останавливается. Программа не идет дальше.
ОБНОВЛЕНИЕ -
Похоже, что реальная проблема с этой ошибкой:
java.lang.UnsatisfiedLinkError: Unable to load library 'tesseract': Native library (linux-x86-64/libtesseract.so) not found in resource path
Посмотрев вокруг много, я не вижу, удобное место, чтобы найти это libtesseract.so
, и я не уверен, что нужно, чтобы получить это на моем Linux-сервере приложений. Я читал, что, возможно, мне нужно загрузить некоторую среду выполнения C++, но я не вижу для нее загрузку Linux. Любые советы будут высоко ценится.
Или это как-то связано с символической ссылкой?
Можно ли указать другую версию при выполнении 'yum install ghostscript'? в противном случае, что является самым простым способом установки GhostScript на Linux без 'yum install'? постскриптум спасибо за так активно помогать тем, кто пытается работать с Tess4J здесь, на SO и в других местах. – mmcrae
Похоже, вы должны [build] (http://ghostscript.com/doc/current/Make.htm#Unix_build) его из [ source] (http://downloads.ghostscript.com/public/), если последнее из репозитория недоступно. – nguyenq
Я переключился с дистрибутива Red Hat на Ubuntu, и он сделал процесс ** так ** намного проще для установки tesseract и ghostscript. 'apt-get install tesseract' получил установку tesseract 3.03 и работу, а' apt-get install ghostscript' получил ghostscript 9.10, работающий нормально. Тупой вопрос: если tesseract установлен и работает сам по себе, и ghostscript, мне нужен только JAR от Tess4J? (а не обучаемые данные, папка tessdata, библиотеки DLL и т. д.) – mmcrae