Предположим, у меня есть 700 000 наблюдений за продуктами, которые имеют определенные атрибуты, позволяют называть их тегами.Какие рамки/db предлагают хорошее решение для фильтрации на основе контента?
И скажем, у нас есть userX. Я хочу реализовать простой метод фильтрации на основе контента: ранжируйте продукты на основе количества тегов/релевантности. Так что давайте говорить userX имеет предпочтение: - желтый - цена (0-15) - Фирменные
Чтобы получить рекомендацию, то потребуется перебрать все 700.000 наблюдения (может быть сделано в базе данных NoSQL настройка нормализации с помощью тегов, но все же может быть много наблюдений при наличии нескольких тегов) и подсчитать количество тегов, которые присутствуют в определенном продукте.
Какую структуру или способ можно использовать для быстрого выполнения? То есть чтобы получить результат в течение нескольких секунд?
Некоторые вещи, которые я думал, были:
- чистый nodejs сервер
- чистый питон сервер
- Neo4j граф базы данных, но не знаете, как отношения могут быть реализованы в этой ситуации?
Для примера в реальном мире это [сообщение в блоге] (http://neo4j.com/blog/date-night-movie-neo4j/) было опубликовано только сегодня, в котором представлены рекомендации по контенту для фильмов. –
Это выглядит очень интересно! На самом деле, ваш пример - это все, что мне нужно ... – JohnAndrews
Мне просто нужно добавить: у меня есть 700 000 предметов, а nb покупок должно быть не более 50 на пользователя. Может ли neo4j справиться с этим качеством? – JohnAndrews