Я использую Markfast нижеTagging Markfast
Сценарий:
WORDLIST PARTICLESLIST = 'NameswithParticles.txt';
DECLARE PARTICLES;
Document{ -> MARKFAST(PARTICLES, PARTICLESLIST,true)};
NameswithParticles.txt:
der
Der
de
De
d'
D'
De la
de La
de la
von
Von
van
Van
ten
La
la
Le
le
L'
St
Al
al
O'
Пример ввода:
1.der Waals radius
2.van Minh
3.Der Brul
4.de Brul
Он отмечает все вышеупомянутые имена частиц, кроме der и Der.
Я не могу воспроизвести проблему. Я получаю четыре аннотации «ЧАСТИЦЫ». Если «MARKFAST» пропускает совпадения, в моем примере есть наиболее вероятные пробелы в txt-файле. –
@ PeterKluegl, я попробовал вышеуказанный вопрос. Я также столкнулся с тем же вопросом –
Какую версию UIMA Ruta вы используете? (Я использовал 2.5.0) –