2016-02-16 7 views
1

У меня есть следующий образец текст:соответствия между разрывами в UIMA РУТЕ на основе состояния

почтового 20193
Нью-Йорк
США

То, что я хотел бы сделать, это только матч «Нью-Йорк "т.е. строка после zipcode.

Я попытался с помощью этого кода, но он не работает -

DECLARE заголовок; контакт BREAK # {-> MARK (заголовок)} BREAK;

(я указал булавка перед этим).

Пожалуйста, дайте мне знать, как это сделать.

Спасибо!

ответ

0

Проблема, вероятно, в настройке фильтрации. BREAK по умолчанию не отображается. Это никогда не будет успешным, потому что рута автоматически пропустит разрывы строк.

Попробуйте добавить еще одно правило изменения настройки фильтрации перед вашим правилом:

RETAINTYPE(BREAK); 
pin BREAK #{-> MARK(heading)} BREAK; 

Там может быть другая проблема, потому что BREAK представляет \ п и \ г. Таким образом, правило не будет работать для окончаний строк Windows. Вам нужно будет что-то вроде:

pin BREAK[1,2] #{-> MARK(heading)} BREAK; 

Существует двигатель анализ Utils в Рута для аннотирования линии: PlainTextAnnotator Если вы включите его, вы можете написать что-то вроде:

pin Line{-> heading}; 

(Вы, возможно, потребуется обрезать линии, например, с действием TRIM, если линии начинаются или заканчиваются непечатаемыми)

ОТКАЗА: Я разработчик UIMA Ruta

+0

Спасибо, Питер, это сработало! –

 Смежные вопросы

  • Нет связанных вопросов^_^