2016-04-19 3 views
0

У меня есть несколько упоминаний концепции (например, «Золото») в моем документе. Однако концептуальный поиск концептуальных понятий вернул бы Золото как концепцию и только один текстовый индекс для этой концепции (обычно это первое вхождение, но не всегда). Существует ли конкретная причина, по которой концептуальный поиск концептуальных понятий игнорирует другие упоминания о «Золоте» в документе? Я заинтересован в вытягивании фрагментов текста вокруг всех вхождений понятия. Было бы здорово, если бы я получил текстовый индекс для всех упоминаний этой концепции. Есть ли способ получить его, кроме как выполнить совпадение строк в конце.Индекс текста Параметр в представлении концепции дает только один пример возникновения концепции

Заранее благодарим за помощь!

ответ

0

Концептуальный поиск из концепции Insights не игнорирует несколько упоминаний одной и той же (или связанной) концепции внутри документа. Фактически, служба использует эту информацию, чтобы укрепить понимание системой концептуальных областей, охваченных в каждом документе.

Однако верно, что в «объяснении» того, почему документ связан с документом, конечная точка /conceptual_search возвращает выбранный набор понятий. Поскольку система пытается показать разнообразие понятий, которые оправдывают связь между вашим запросом и документом, он может опустить повторяющиеся концепции как часть «объяснения» (вы можете подумать об этом «объяснении», аналогичном фрагменту текста, который традиционная поисковая система может предложить пользователю, почему документ может быть уместным, это не полная история ассоциаций, найденных в документе).

Это, как говорится, может получить все концепции, извлеченные в документе, с использованием конечной точки/аннотации: GET /v2/corpora/{account_id}/{corpus}/documents/{document}/annotations.

(Документация: https://watson-api-explorer.mybluemix.net/apis/concept-insights-v2#!/corpora/getDocumentAnnotations)

Для каждого примечания в документе, вы получите понятие идентификатор вместе с позициями в тексте для появления документа. Итак, для вашего примера выше, вы можете:

1) Вызвать конечную точку /conceptual_search для получения документов, относящихся к вашему запросу, а также ряд концепций объяснения (концепции, связывающие документ с вашим запросом); скажем, вы обнаружили, что концепция - вопрос Gold.

2) Вызвать /{document}/annotations для возвращенного документа в поисках дополнительных вхождений «понятийных понятий» (Gold) в пределах выбранного документа. Вы должны иметь возможность создавать список из Gold вхождений (наряду со списками других концепций объяснения), которые охватывают весь документ.