После некоторых проб и ошибок, я получил эту работу.
Правильный подход заключается в том, чтобы включить полностью определенный путь к XML-файлу обновления пользовательского обновления в качестве аргумента параметра -stemming-updates для Dgidx.
Вот соответствующая часть моей Endeca/приложений/MyAppen/Config/скрипт/DataIngest.xml:
<dgidx id="Dgidx" host-id="ITLHost">
...
<args>
...
<arg>--stemming-updates</arg>
<arg>/full/path/to/endeca/apps/MyAppen/config/script/stemmingExtension.en.xml</arg>
</args>
</dgidx>
я обнаружил, что --stemming обновления и фактический полностью указанный путь должен быть в раздельный <arg> теги; возникает ошибка, если вы попытаетесь поместить их в один и тот же тег arg, разделенные пробелом.
Возможно, существует определенная папка, в которой вы можете поместить файл XML обновления обновления, не требуя полного указания пути к файлу, но я обнаружил, что ни endeca/MDEX/version/conf/stemning, ни завершение/conf для этого. Когда я попробовал это, я получил ошибку в dgidx войти как:
ERROR 08/20/13 13:48:46.810 UTC (1377006526810) DGIDX {dgidx,baseline} InputFileStream can't open file "stemmingExtension.en.xml" for reading [err=`No such file or directory',errno=2]
Я также обнаружил, что есть ошибка в XML выборки, представленной в MDEX Advanced Guide Development Engine Endeca, 6.2.2 версии. В документации приведены первые две строки XML-файла:
<!DOCTYPE WORD_FORMS_COLLECTION SYSTEM "word_forms_collection_updates.dtd">
<WORD_FORMS_COLLECTION_UPDATES>
Это неверное описание. При попытке использовать файл в этом формате, эта ошибка возникает в журнале dgidx:
FATAL 08/20/13 13:56:33.533 UTC (1377006993533) DGIDX {dgidx,baseline} Errors while parsing word forms updates from file "full/path/to/endeca/apps/MyAppen/config/script/stemmingExtension.en.xml": Errors while trying to parse config stream "full/path/to/endeca/apps/MyAppen/config/script/stemmingExtension.en.xml": Error at file full/path/to/endeca/apps/MPen/config/script/stemmingExtension.en.xml, line 2, column 31; Message: Root element different from DOCTYPE
Исправление это изменить DOCTYPE строку в файле XML, чтобы соответствовать корневой тег, например:
<!DOCTYPE WORD_FORMS_COLLECTION_UPDATES SYSTEM "word_forms_collection_updates.dtd">
<WORD_FORMS_COLLECTION_UPDATES>
Я открыл билет с поддержкой Oracle для этой (очевидной) ошибки.
Я хотел добавить опцию --threads. При добавлении --threads , не было затронуто, если вы запустите компонент из Endeca-workbench (Endeca-workbench -> EAC-Admin-Console). Но это было затронуто, когда индексирование было запущено с помощью функции «/ atg/commerce/endeca/index/EndecaScriptService», которая напрямую вызывает «Endeca Application Controller», –