2015-02-25 4 views
0

Я построил индекс в лазурном поиске. индекс содержит несколько полей, но только 2 поля, которые я обозначил как доступные для поиска. индекс содержит полные слова pdf-файлов разных размеров (их текст, конечно) и его purporse, чтобы иметь возможность использовать в поиске документов.azure search performance issue

Индекс большой размер - 160 тыс. Документов и размер 7,2 г.

Когда я делаю запрос до двух букв, все работает, но когда я нажимаю сложные слова, производительность плоха.

например: фраза - elasti занимает 59 секунд.

В моем запросе - я использовать фильтр, забив профиль блик

после некоторого исследования - я могу видеть, что функция изюминки является причиной проблемы.

Любая идея? как повысить производительность - возможно, разбить на несколько полей в индексе или что-то в этом роде?

ответ

1

Мы развернули изменение, которое улучшает производительность маркера на этой неделе. Для включения функции требуется переиндексирование. Пожалуйста, не стесняйтесь обращаться ко мне напрямую на [email protected], если проблема не устранена. Еще раз спасибо за ваше время.

Nate

+0

спасибо. я заглядываю в него - быстрый вопрос - как вы переиндексируете? загрузить документ еще раз? – Ram

+0

Вам нужно будет создать новый индекс и загрузить документы. BTW, какие анализаторы языка вы используете? Благодаря! –

+0

@NatoKo извините за поздний отклик. На данный момент я не использую анализатор языка. Я перестрою индекс и посмотрю, не решена ли проблема. благодаря – Ram

0

Ваша догадка правильная - поиск подсветки вызывает здесь проблему. Когда подсветка включена, Azure Search обрабатывает каждый элемент/текст в результирующем наборе в времени запроса для поиска текстовых сегментов, содержащих хиты поиска. Если каждый текст равен 4,5 МБ (7,2 гб/160 тыс.), Процесс может занять много времени. Что касается сложных терминов или фраз, которые занимают больше времени, это связано с тем, что Azure Search перестает обрабатывать результат после того, как найдет достаточное количество сегментов. Я работаю в команде Azure Search. Я посмотрю код и подтвержу.

+0

OK. Итак, как я могу это исправить? есть ли способ ограничить количество фраз? Я бы подумал, что если в индексе поиска будут указаны слова, которые он поставил бы там, где они находятся в документах, чтобы избежать поиска всего документа. И Microsoft должна поместить в документацию, которая выделяет опцию, имеет ограничение производительности. весь проект, над которым я в настоящее время работает, основан на подсветке, и я хотел бы иметь какое-то решение для этого. – Ram

+0

Мы активно изучаем способы повышения эффективности поиска, особенно при подсветке. Мы скоро вернемся к теме. –

+0

@NateKo у вас, ребята, репозиторий github или что-то, что можно было бы задавать, у меня довольно много проблем с Azure Search прямо сейчас, когда я хочу подчиниться и следить. –

 Смежные вопросы

  • Нет связанных вопросов^_^