2015-04-21 2 views
1

Я проектирование добычи текста трубопровода в UIMA DUCC следующим образом:Как определить несколько потребителей CAS в UIMA DUCC?

|-----------------| 
|     | ==CAS_1==> Pipeline A ==> Consumer A 
| CAS Multiplier | ==CAS_2==> Pipeline B ==> Consumer B 
|     | ==CAS_3==> Pipeline C ==> Consumer C 
|-----------------| 

Я намерен запустить Piepline A, B и C параллельно. Я считаю, что это можно сделать с помощью контроллера потока. Неужели я прав? Если да, то как определить несколько CC. Поле process_descriptor_CC в файле описания должно принимать только одного потребителя. Как мы можем передать несколько потребителей и их ассоциацию пипепин?

ответ

1

Если намерение состоит в том, чтобы обработать большую коллекцию документов с высокой пропускной способностью, то три трубопровода, каждый из которых включает его CAS потребителя, все были бы в АЕ (process_descriptor_AE) и АЕ будет включать в себя контроллер пользовательского потока для маршрутизации CASes по желанию. Случаи, в АЕ будет работать один на один раз, но несколько CM + AE потоков могут выполняться параллельно, указав номер из JP нитей (process_thread_count) быть больше 1.

0

сделать контроллер потока и добавить клиента cas в качестве механизма анализа делегата. таким образом вы можете добавить столько, сколько хотите. , затем укажите путь управления потоком в дескрипторе развертывания и укажите этот путь в спецификации задания.

1

Во-первых, вы должны понять контроллер потока и создать совокупный дескриптор с использованием контруллера потока и добавить дескриптор потребительского дескриптора так же, как дескриптор механизма анализа в контроллере потока.

После этого есть два варианта использования для вашего сценария:

  1. Используйте process_descriptor_CR и только process_descriptor_AE и использовать на основе контроллера потока совокупного дескриптора в AE.

  2. Используйте только process_descriptor_CR и process_dd и используйте дескриптор агрегата на основе контроллера потока в дескрипторе развертывания.