2014-10-28 6 views
0

Я планирую создать партнерский сайт (сайт сравнения цен).Сравнение продуктов для сайта Affiliate

Как вы все знаете, DATA (продукты и их информация.) С разных сайтов (сайты Ecomm) играет жизненно важную роль в этих типах сайтов сравнения цен.

Я уже написал сценарии для изъятия данных для продуктов с сайтов моего интереса и работы, как ожидалось.

Более подробно, я отказываюсь от общих параметров и сохраняю их в своей БД. 1) продукт Название, 2) Описание продукта, 3) Цена, 4) Оплатите режимы и т.д. [FYI: Я использовал JSOUP API для лома данных]

ПРОБЛЕМА НАЧАЛА ЗДЕСЬ:

I хотите сгруппировать продукты [того же продукта] из разных источников, из которых I с этих сайтов.

Чтобы проиллюстрировать мое квестование: Say XYZ является продуктом, продаваемым на 5 различных сайтах с некоторыми изменениями в ее заголовке.

Я отказался от данных из этих 5 сайтов, которые сохранили его в моей БД теперь, как я должен эффективно группировать эти продукты в одну группу. так что я могу показать 5 разных источников на одной странице моего сайта.

У меня нет ни малейшего представления о том, как я должен действовать в нем.

[Сравнение строк является первой мыслью, которая приходит мне в голову, но не думаю, что я буду работать в долгосрочной перспективе.]

Любые предложения/рекомендации приветствуются и ценится.

Мне нужна дополнительная информация, пожалуйста, не стесняйтесь добавлять комментарии.

-JS

+0

Привет @ Jagdeep84. У вас есть успех в выполнении этой работы? Я тоже застрял в такой же ситуации. Plz скажите мне, если вы это сделали. –

ответ

0

На начальном этапе вы можете использовать Solr для получения лучшего результата в то время как сравнение названия продукта или его описание более того.

Более подробно, если мы думаем о стороне пользователя, почему продукт считается общим продуктом. это те функции, которые делают продукт распространенным. как бренд, цвет, материал бла-бла ....

Сделайте словарь набора функций для разных каталогов, который должен быть таким же, объявляя какой-либо продукт как общий продукт. возможно, тогда для одного и того же набора функций у нас будет много продуктов для идентификации, в этом случае u может взять на себя помощь от solr для подсчета очков ...

Кроме того, вы можете проверить google image search api, который в конце поможет получить оценку подобия изображения. это будет полезно в нахождении общих продуктов для модных каталогов

Надеются, что это поможет ...

+0

Спасибо Ананд, для ответа на эту тему, я обязательно попробую выяснить, до какой степени это поможет в этом случае. – Jagdeep84