У меня возник вопрос о своеобразном поведении, которое я заметил в своем пользовательском анализаторе (а также в анализаторе fr.microsoft). Нижеприведенные аналитические тесты API показаны с использованием анализатора «fr.microsoft», но я видел то же точное поведение, когда я использую собственный анализатор «text_contains_search_custom_analyzer» (что имеет смысл, поскольку я основываю его на анализаторе fr.microsoft).Azure Поиск: поиск сингулярной версии слова, но все же включение множественной версии в результаты
UAT сообщила, что, когда они ищут «femme» (единственное число), они ожидают, что документы с «femmes» (множественное число) также будут найдены. Но когда я тестировал API-интерфейс анализа, кажется, что служба поиска Azure только символизирует множественное число -> множественное число + сингулярное, но при символическом сингулярности используются только особые токены. Ниже приведены примеры.
Есть ли способ, которым я могу позволить пользователю искать единственную версию слова, но все же включать множественную версию этого слова в результаты поиска? Или мне нужно использовать синонимы для преодоления этой проблемы?
Запрос с «роковым» { "анализатор": "fr.microsoft", "текста": "рокового" }
ответ от «рокового» { «@ odata.context ":" https://EXAMPLESEARCHINSTANCE.search.windows.net/ $ метаданных # Microsoft.Azure.Search.V2016_09_01.AnalyzeResult " "жетоны": [{ "маркер": "роковая", "startOffset": 0, " endOffset «: 5, "позиция": 0} ] }
Запрос с„роковых“ { "анализатор": "fr.microsoft", "текст": "роковых" }
Ответ от «роковых» { "@ odata.context": "https://EXAMPLESEARCHINSTANCE.search.windows.net/ $ метаданных # Microsoft.Azure.Search.V2016_09_01.AnalyzeResult", "жетоны": [ { "маркер": "роковая", "startOffset": 0, "endOffset": 6, "позиция": 0 }, { "маркеров": "Femmes", "startOffset": 0, "endOffset": 6, "позиция": 0} ] }