У меня есть список из 50 миллионов продуктов. Каждый продукт имеет список из 200 функций. Я ищу, чтобы найти похожие продукты, сопоставляя функции продукта, которые имеют максимальное перекрытие по 200 функциям.Elasticsearch: Поиск похожих продуктов
В настоящее время я объединяю 200 слов с пробелами и формирую длинную строку. Когда я хочу найти похожие продукты для определенного выбранного продукта, я извлекаю сохраненную строку длиной 200 слов и поиск elasticsearch.
Это дает ожидаемые результаты, но каждый поиск занимает примерно 7 секунд. Это потому, что поисковая фраза настолько длинная. Есть ли лучший способ сделать это и найти лучшее перекрытие на эластике?