Новое для JS и очень новое для узла. Запуск Tesseract.js (программное обеспечение для распознавания текста: http://tesseract.projectnaptha.com) в Safari занимает около 10 секунд и начинает немедленно выводить прогресс.
Узел (v6.9.1) (работает от терминала или через электронный) запускает CPU до 100% в течение 4 минут 20 секунд прежде, чем он начнет выводить на консоль. Затем он заканчивается примерно в то же время.Node.js 20x медленнее, чем браузер (Safari) с Tesseract.Js
Какие шаги по устранению неисправностей рекомендуются? Это распространено для узла?
Единственное отличие, которое я вижу в журналах, - это Safari «найдено в кеше eng.traineddata». Очистка и отключение кеша минимально влияет на время. Попробовали несколько файлов .JPG и .PNG (300-600kb) с таким же результатом - но BMP (3.7MB) дал быстрый ответ 17 секунд - тогда ошибки и не закончились. (Является ли это 'следующий тик' проблема?)
var Tesseract = require('tesseract.js');
var image = "./images/sample.jpg";
function tesseract(){
Tesseract.recognize(image)
.progress(function(message){console.log(message)})
.then(result => console.log(result.text))
}
tesseract();
(редактор форсирует вывод отформатирована в виде кода)
УЗЕЛ console.log
>Bash-3.2$ node JustTess.js
*Waits 4+ min and Then*
{ status: 'loading tesseract core' }
{ status: 'loaded tesseract core' }
{ status: 'initializing tesseract', progress: 0 }
pre-main prep time:108 ms
{ status: 'initializing tesseract', progress: 1 }
{ status: 'loading eng.traineddata', progress: 0 }
{ status: 'loading eng.traineddata', progress: 1 }
{ status: 'initializing api', progress: 0 }
{ status: 'initializing api', progress: 0.3 }
{ status: 'initializing api', progress: 0.6 }
{ status: 'initializing api', progress: 1 }
{ status: 'recognizing text', progress: 0 }
{ status: 'recognizing text', progress: 0.014285714 }...
SAFARI console.log
>[Log] – {status: "loading tesseract core"}
[Log] – {status: "loaded tesseract core"}
[Log] – {status: "initializing tesseract api"}
[Log] pre-main prep time: 115 ms (index.js, line 10)
[Log] – {status: "initialized tesseract api"}
[Log] – {status: "found in cache eng.traineddata"}
[Log] – {status: "loaded eng.traineddata"}
[Log] – {status: "initialized with language"}
[Log] – {status: "recognizing text", progress: 0}
[Log] – {status: "recognizing text", progress: 0.0142}...
УЗЕЛ с BMP
bash-3.2$ node JustTess.js
*After 17 sec*
{ status: 'initializing tesseract', progress: 0 }
pre-main prep time: 118 ms
{ status: 'initializing tesseract', progress: 1 }
{ status: 'loading eng.traineddata', progress: 0 }
{ status: 'loading eng.traineddata', progress: 1 }
{ status: 'initializing api', progress: 0 }
{ status: 'initializing api', progress: 0.3 }
{ status: 'initializing api', progress: 0.6 }
Error in pixRemoveColormap: pixs must be {1,2,4,8} bpp
Error in pixGetDepth: pix not defined
Error in pixGetWpl: pix not defined
Error in pixCreateHeader: depth must be {1, 2, 4, 8, 16, 24, 32}
Error in pixCreateNoInit: pixd not made
Error in pixCreateTemplateNoInit: pixd not made
Error in pixCreateTemplate: pixd not made
Error in pixCopy: pixd not made
{ status: 'initializing api', progress: 1 }
3
3
/Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programming/GitHub/ba/node_modules/tesser
act.js-core/index.js:4
function f(a){throw a;}var h=void 0,i=!0,j=null,k=!1;function aa(){return function(){}}function ba(
a){return function(){return a}}var n,Module;Module||(Module=eval("(function() { try { return Tesser
actCore || {} } catch(e) { return {} } })()"));var ca={},da;for(da in Module)Module.hasOwnProperty(
da)&&(ca[da]=Module[da]);var ea=i,fa=!ea&&i;
^
abort(3) at Error
at Error (native)
at Na (/Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programming/GitHub/ba/node_mod
ules/tesseract.js-core/index.js:32:26)
at ka (/Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programming/GitHub/ba/node_mod
ules/tesseract.js-core/index.js:507:108)
at Array.JHa (/Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programming/GitHub/ba/n
ode_modules/tesseract.js-core/index.js:402:25808)
at xd (/Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programming/GitHub/ba/node_mod
ules/tesseract.js-core/index.js:382:924)
at R.TesseractCore.V.Begin (/Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programmi
ng/GitHub/ba/node_modules/tesseract.js-core/index.js:511:288)
at DumpLiterallyEverything (/Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programmi
ng/GitHub/ba/node_modules/tesseract.js/src/common/dump.js:13:8)
at /Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programming/GitHub/ba/node_modules
/tesseract.js/src/common/worker.js:121:22
at /Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programming/GitHub/ba/node_modules
/tesseract.js/src/common/worker.js:92:9
at /Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programming/GitHub/ba/node_modules
/tesseract.js/src/node/lang.js:14:25
If this abort() is unexpected, build with -s ASSERTIONS=1 which can give more information.
Пробовал свое демо на моем узле (6.9.1) - работает так же быстро в браузере. Единственное, что приходит на ум - им нужен узел 6.8 или выше, но вы упомянули 6.7. Также этот вопрос может быть таким же, как и у вас: https://github.com/naptha/tesseract.js/issues/53 – Andrey
Спасибо. Обновлен узел и попытался с .png также с тем же результатом. И это похоже на ту же проблему. Еще раз спасибо. –