2015-09-18 2 views
2

Я использую regexner для поиска именованных объектов, которые не находятся в стандартном наборе Stanford NLP, и он отлично работает. Однако, когда я добавляю аннотатор ner, он аннотирует токены, которые соответствуют моему регулярному выражению с тегами по умолчанию. Как перезаписать аннотации по умолчанию?NER вмешивается в REGEXNER

def createNLPPipelineRegex(): StanfordCoreNLP = { 
    val props = new Properties() 
    props.put("regexner.mapping", "regex.txt") 
    props.put("annotators", "tokenize, ssplit, regexner, pos, lemma, ner") 
    props.put("tokenize.options", "untokenizable=noneKeep,normalizeParentheses=false") 
    new StanfordCoreNLP(props) 

}

ответ

2

Если добавить regexner после нер комментатора, он должен работать:

props.put("annotators", "tokenize, ssplit, pos, lemma, ner, regexner") 
+0

большой, спасибо! –