Концептуальный поиск из концепции Insights не игнорирует несколько упоминаний одной и той же (или связанной) концепции внутри документа. Фактически, служба использует эту информацию, чтобы укрепить понимание системой концептуальных областей, охваченных в каждом документе.
Однако верно, что в «объяснении» того, почему документ связан с документом, конечная точка /conceptual_search
возвращает выбранный набор понятий. Поскольку система пытается показать разнообразие понятий, которые оправдывают связь между вашим запросом и документом, он может опустить повторяющиеся концепции как часть «объяснения» (вы можете подумать об этом «объяснении», аналогичном фрагменту текста, который традиционная поисковая система может предложить пользователю, почему документ может быть уместным, это не полная история ассоциаций, найденных в документе).
Это, как говорится, может получить все концепции, извлеченные в документе, с использованием конечной точки/аннотации: GET /v2/corpora/{account_id}/{corpus}/documents/{document}/annotations
.
(Документация: https://watson-api-explorer.mybluemix.net/apis/concept-insights-v2#!/corpora/getDocumentAnnotations)
Для каждого примечания в документе, вы получите понятие идентификатор вместе с позициями в тексте для появления документа. Итак, для вашего примера выше, вы можете:
1) Вызвать конечную точку /conceptual_search
для получения документов, относящихся к вашему запросу, а также ряд концепций объяснения (концепции, связывающие документ с вашим запросом); скажем, вы обнаружили, что концепция - вопрос Gold
.
2) Вызвать /{document}/annotations
для возвращенного документа в поисках дополнительных вхождений «понятийных понятий» (Gold
) в пределах выбранного документа. Вы должны иметь возможность создавать список из Gold
вхождений (наряду со списками других концепций объяснения), которые охватывают весь документ.