2016-09-13 3 views
-2

я столкнулся такая же проблема, как Stanford CoreNLP OpenIE annotator Стараюсь выход = nlp.annotate (с, свойства = { "аннотаторы": "разметить, ssplit, пос, depparse, natlog, openie", "OUTPUTFORMAT" : «json», «openie.triple.strict»: «true», «openie.max_entailments_per_clause»: «1», «openie.splitter.disable»: «true»})StanfordCoreNLP openIE вопрос

Но все же я получаю 4 статьи

(u'are pull from ', u'Twenty percent electric motors', u'assembly line ') (u'are pull from', u'percent electric motors ', u'assembly line') (u ' «U'Twenty percent electric motors», u'pulled ') (u'are', u'percent electric motors ', u'pulled') Я делаю что-то неправильно? Как получить точный тройной ('тянут от', '20 процентов электродвигателей', 'сборочная линия')

+0

Понимая, что это ожидаемое поведение, я написал несколько сценариев, чтобы отфильтровать отношения, которые содержатся в других отношениях. Спасибо за ответ Габор Анджели – Prathamesh

ответ

1

Это на самом деле ожидаемое поведение. Это было дизайнерское решение в системе OpenIE для создания всех троек, которые логически связаны с первоначальным предложением, даже если они являются избыточными. Идея состоит в том, что эти тройки обычно используются для чего-то похожего на поиск IR-ish, и в этих случаях удобно не выполнять нечеткое совпадение, независимо от того, является ли какой-либо из троек «достаточно похожим» на запрос.