Я использовал файл данных кинофильма (ml-100k.zip) u.data без изменений, поэтому у него были столбцы: userID, MovieID и рейтинг пользователей.Если я использую SIMILARITY_LOGLIKELIHOOD (LLR), рейтинг элементов действительно игнорируется?
Я использовал ЛОП:
Hadoop банку C: \ HDP \ Mahout-0.9.0.2.1.3.0-1981 \ ядро \ цель \ погонщик-ядро-0.9.0.2.1.3.0-1981-работу .jar org.apache.mahout.cf.taste.hadoop.item.RecommenderJob -s SIMILARITY_LOGLIKELIHOOD --input u.data --output udata_output
Когда я смотрю на файл udata_output я вижу рекомендовал фильм идентификаторы следует рекомендация оценка как:
1226: 5,0 и 896: 4,798878
Оценки рекомендаций казалось варьироваться от 5,0 до 4.x
Однако, когда я удален столбец рейтинг пользователя из u.data файла и повторно запустили такую же командную строку выше, я получил результаты, как:
615: 1.0
, где ВСЕ рекомендации были 1,0.
2 вопросы:
1) Если ЛОП игнорирует рейтинги пользователей и единственный вход меняю является ли обеспечить рейтинг пользователей почему изменить баллы рекомендаций?
2) В целом, я пытаюсь определить рейтинг рекомендаций, поэтому я использую LLR. Кроме того, следует игнорировать рекомендации и сосредоточиться только на заказах рекомендованных товаров (например: первый элемент занимает выше второго)?
Заранее спасибо.
Еще раз спасибо. Кроме того, я не понимал, что использую более старую версию Hadoop. Я рассмотрю более новую, которую вы предложили. – RandomTask
Посмотрите в Mahout 1.0-SNAPSHOT. Это совершенно другая архитектура, чем версии Hadoop или in-memory. – pferrel