В нашем случае у нас есть поток кликов пользователей, атрибуты элементов (например, категория, теги и т. Д.), Избранные элементы и коллекции для элементов. Как мы можем объединить эти данные в качестве входных данных Myrrix?Как мы можем объединить несколько типов данных в Myrrix для рекомендации?
ответ
В основном вы пытаетесь моделировать взаимодействия между пользователями и элементами. Способ моделирования различных взаимодействий заключается в назначении каждому из них индикатора силы. Например, вы можете утверждать, что клик имеет силу 2, любимую силу 5 и, возможно, покупку, равную 15 (я просто говорю цифры из головы).
Пример входных данных:
user1,item1,2 => he view the item
user1,item1,5 => he made the item a favorite
user1,item1,15 => he purchased the item
Теперь, внутренне, Myrrix добавит все эти значения, чтобы указать довольно сильное предпочтение пункта, следовательно, вы бы держать все взаимодействия (и не только самый сильный)
Мета-данные, которые могут быть у пользователя или предмета, также могут быть представлены Myrrix как «теги», чтобы лучше информировать модель. Таким образом, вы можете сказать, что пользователь «женский», или предмет «джинсы». Вы можете иметь несколько тегов для каждого пользователя или элемента, и каждому тегу может быть назначен вес.
Согласен. Я могу добавить еще несколько рекомендаций: http://myrrix.com/tuning-quality/ Например, весы могут быть выбраны по относительной частоте в данных. Что-то, что в 20 раз реже, может иметь 20-кратный больший вес. Кроме того, см. Новый API «тегов» в качестве удобного способа добавления информации о категории/тегах: http://myrrix.com/rest-api/ –
Получил, если входные данные имеют одинаковые идентификаторы пользователя и ItemID, сила увеличивается вместо замены! И снова у меня вопрос. Если я перезапущу Myrrix с тем же самым именем ввода, будут ли те же данные csv в том, что inputDir будет снова прочитан или увеличит старое значение или просто проигнорирует? – piaolingxue