2
Я использую regexner для поиска именованных объектов, которые не находятся в стандартном наборе Stanford NLP, и он отлично работает. Однако, когда я добавляю аннотатор ner, он аннотирует токены, которые соответствуют моему регулярному выражению с тегами по умолчанию. Как перезаписать аннотации по умолчанию?NER вмешивается в REGEXNER
def createNLPPipelineRegex(): StanfordCoreNLP = {
val props = new Properties()
props.put("regexner.mapping", "regex.txt")
props.put("annotators", "tokenize, ssplit, regexner, pos, lemma, ner")
props.put("tokenize.options", "untokenizable=noneKeep,normalizeParentheses=false")
new StanfordCoreNLP(props)
}
большой, спасибо! –