2015-03-12 4 views
1

Я использую org.apache.uima.examples.cpe.SimpleRunCPE в своей программе Java, которая принимает в качестве входного файла XML-файл CpeDescription.Как запустить UIMA в списке файлов?

Этот файл имеет имяValuePair для InputDirectory, в котором указывается, где должны работать текстовые файлы, с которыми должен работать UIMA.

Как бы мне запустить CPE в указанном списке файлов?

Фон состоит в том, что у меня очень много текстовых файлов в каталоге для запуска UIMA для генерации файлов CAS. Если после нескольких дней работы процесс UIMA внезапно должен остановиться (сбой из-за нехватки памяти или компьютер должен быть перезагружен), я хотел бы запустить процесс только для оставшихся необработанных файлов.

Как я буду продолжать об этом?

ответ

2

В вашем XML-файле CpeDescription вам необходимо будет изменить свой CollectionReader, чтобы принять новый параметр (например, список файлов или регулярное выражение), чтобы отфильтровать файлы, которые уже были обработаны. Here some code и tests, чтобы вы начали.

Другим обходным решением является структурирование вашего большого InputDirectory в небольших подкаталогах и запуск UIMA CPE для каждого из них. Таким образом, если одна партия CPE выходит из строя, вы можете просто перезапустить ее.

 Смежные вопросы

  • Нет связанных вопросов^_^