2016-06-13 7 views
2

FirstToken не найден для какой-либо ссылки (которая содержит место в конце).FirstToken не найден для некоторых ссылок-UIMA RUTA

Сценарий:

DECLARE FirstToken, LastToken; 

BLOCK(InRef) Reference{}{ 
    ANY{POSITION(Reference,1) -> MARK(FirstToken)}; 
    Document{-> MARKLAST(LastToken)}; 
} 

Входные файлы:

1. Ferreira, F.R., Prado, S.D., Carvalho, M.C, and Kraemer, F.B. (2015). Biopower and biopolitics in the field of food and nutrition. Revista de Nutrição, 28(1), 109-119. Available at http://dx.doi.org/10.1590/1415-52732015000100010. 
2. Ali, S. (2007). Feminism and postcolonialism: Knowledge/politics. Ethnic and Racial Studies, 30(2), 191–212. 
3. Forbes, D.A., King, K.M., Kushner, K.E., Letourneau, N.L., Myrick, A.F., and Profetto-McGrath, J. (1999). Warrantable evidence in nursing science. Journal of Advanced Nursing, 29(2), 373–379. 

ответ

1

аннотаций, которые начинаются или заканчиваются чем-то невидимым, также не видно. Это определение может показаться неинтуитивным, но оно необходимо для последовательного сопоставления.

Это происходит чаще всего, если некоторые аннотации начинаются концами с пробела. Рекомендуется удалить/подрезать эти пробелы из аннотации, например, с:

RETAINTYPE(WS); // or RETAINTYPE(SPACE, BREAK,...); 
Reference{-> TRIM(WS)}; 
RETAINTYPE; 

Вы также можете работать на аннотации, которые заканчиваются в пространстве, если вы делаете пространства видимыми:

RETAINTYPE(SPACE); 

Кроме этого , вы также можете использовать действие MARKFIRST, например, действие MARKLAST вместо условия POSITION, которое очень медленно.

ОТКАЗ: Я разработчик UIMA Ruta

+0

Я попытался RETAINTYPE (WS); Ссылка {-> TRIM (WS)}; RETAINTYPE; Его работа хорошая. –