2016-11-07 3 views
5

Новое для JS и очень новое для узла. Запуск Tesseract.js (программное обеспечение для распознавания текста: http://tesseract.projectnaptha.com) в Safari занимает около 10 секунд и начинает немедленно выводить прогресс.
Узел (v6.9.1) (работает от терминала или через электронный) запускает CPU до 100% в течение 4 минут 20 секунд прежде, чем он начнет выводить на консоль. Затем он заканчивается примерно в то же время.Node.js 20x медленнее, чем браузер (Safari) с Tesseract.Js

Какие шаги по устранению неисправностей рекомендуются? Это распространено для узла?
Единственное отличие, которое я вижу в журналах, - это Safari «найдено в кеше eng.traineddata». Очистка и отключение кеша минимально влияет на время. Попробовали несколько файлов .JPG и .PNG (300-600kb) с таким же результатом - но BMP (3.7MB) дал быстрый ответ 17 секунд - тогда ошибки и не закончились. (Является ли это 'следующий тик' проблема?)

var Tesseract = require('tesseract.js'); 
var image = "./images/sample.jpg"; 

function tesseract(){ 
Tesseract.recognize(image) 
.progress(function(message){console.log(message)}) 
.then(result => console.log(result.text)) 
} 
tesseract(); 

(редактор форсирует вывод отформатирована в виде кода)
УЗЕЛ console.log

>Bash-3.2$ node JustTess.js 
    *Waits 4+ min and Then* 
{ status: 'loading tesseract core' } 
{ status: 'loaded tesseract core' } 
{ status: 'initializing tesseract', progress: 0 } 
pre-main prep time:108 ms 
{ status: 'initializing tesseract', progress: 1 } 
{ status: 'loading eng.traineddata', progress: 0 } 
{ status: 'loading eng.traineddata', progress: 1 } 
{ status: 'initializing api', progress: 0 } 
{ status: 'initializing api', progress: 0.3 } 
{ status: 'initializing api', progress: 0.6 } 
{ status: 'initializing api', progress: 1 } 
{ status: 'recognizing text', progress: 0 } 
{ status: 'recognizing text', progress: 0.014285714 }...     

SAFARI console.log

>[Log] – {status: "loading tesseract core"} 
[Log] – {status: "loaded tesseract core"} 
[Log] – {status: "initializing tesseract api"} 
[Log] pre-main prep time: 115 ms (index.js, line 10) 
[Log] – {status: "initialized tesseract api"} 
[Log] – {status: "found in cache eng.traineddata"} 
[Log] – {status: "loaded eng.traineddata"} 
[Log] – {status: "initialized with language"} 
[Log] – {status: "recognizing text", progress: 0} 
[Log] – {status: "recognizing text", progress: 0.0142}...  

УЗЕЛ с BMP

bash-3.2$ node JustTess.js 
*After 17 sec* 
    { status: 'initializing tesseract', progress: 0 } 
pre-main prep time: 118 ms 
{ status: 'initializing tesseract', progress: 1 } 
{ status: 'loading eng.traineddata', progress: 0 } 
{ status: 'loading eng.traineddata', progress: 1 } 
{ status: 'initializing api', progress: 0 } 
{ status: 'initializing api', progress: 0.3 } 
{ status: 'initializing api', progress: 0.6 } 
Error in pixRemoveColormap: pixs must be {1,2,4,8} bpp 
Error in pixGetDepth: pix not defined 
Error in pixGetWpl: pix not defined 
Error in pixCreateHeader: depth must be {1, 2, 4, 8, 16, 24, 32} 
Error in pixCreateNoInit: pixd not made 
Error in pixCreateTemplateNoInit: pixd not made 
Error in pixCreateTemplate: pixd not made 
Error in pixCopy: pixd not made 
{ status: 'initializing api', progress: 1 } 
3 
3 

/Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programming/GitHub/ba/node_modules/tesser 
act.js-core/index.js:4 
function f(a){throw a;}var h=void 0,i=!0,j=null,k=!1;function aa(){return function(){}}function ba(
a){return function(){return a}}var n,Module;Module||(Module=eval("(function() { try { return Tesser 
actCore || {} } catch(e) { return {} } })()"));var ca={},da;for(da in Module)Module.hasOwnProperty(
da)&&(ca[da]=Module[da]);var ea=i,fa=!ea&&i; 
      ^
abort(3) at Error 
    at Error (native) 
    at Na (/Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programming/GitHub/ba/node_mod 
ules/tesseract.js-core/index.js:32:26) 
    at ka (/Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programming/GitHub/ba/node_mod 
ules/tesseract.js-core/index.js:507:108) 
    at Array.JHa (/Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programming/GitHub/ba/n 
ode_modules/tesseract.js-core/index.js:402:25808) 
    at xd (/Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programming/GitHub/ba/node_mod 
ules/tesseract.js-core/index.js:382:924) 
    at R.TesseractCore.V.Begin (/Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programmi 
ng/GitHub/ba/node_modules/tesseract.js-core/index.js:511:288) 
    at DumpLiterallyEverything (/Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programmi 
ng/GitHub/ba/node_modules/tesseract.js/src/common/dump.js:13:8) 
    at /Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programming/GitHub/ba/node_modules 
/tesseract.js/src/common/worker.js:121:22 
    at /Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programming/GitHub/ba/node_modules 
/tesseract.js/src/common/worker.js:92:9 
    at /Users/brent/Library/Mobile Documents/com~apple~CloudDocs/Programming/GitHub/ba/node_modules 
/tesseract.js/src/node/lang.js:14:25 
If this abort() is unexpected, build with -s ASSERTIONS=1 which can give more information. 
+0

Пробовал свое демо на моем узле (6.9.1) - работает так же быстро в браузере. Единственное, что приходит на ум - им нужен узел 6.8 или выше, но вы упомянули 6.7. Также этот вопрос может быть таким же, как и у вас: https://github.com/naptha/tesseract.js/issues/53 – Andrey

+0

Спасибо. Обновлен узел и попытался с .png также с тем же результатом. И это похоже на ту же проблему. Еще раз спасибо. –

ответ

0

Я не могу ответить на вопрос; однако другие ответы не проливают много света на этот вопрос. См. http://www.jsbenchmarks.com/?anywhichway/lookup/master/benchmark.js/ для примера того, как NodeJS и браузеры сильно различаются по нескольким функциям. Обратите внимание, хотя результаты браузера на этом сайте принадлежат нескольким посетителям, а результаты узла - с одного сервера, тесты в изолированной среде показывают одно и то же.

0

Эта проблема была решена путем обновления программного обеспечения Tesseract.Js.