2017-01-27 35 views
0

Я работаю над созданием механизма совместной работы с деталями. Набор данных доступен имеет размер:Ошибка при создании матрицы оценки пользовательского элемента для фильтра совместной работы на основе предметов

Количество пользователей: ок (3,00,000)

Количество деталей: 525

recommenderlab пакет в R требует рейтинговую матрицу пользовательского элемента. У меня есть таблица с расплавленными данными со столбцами: User_Code, Item_Code, Рейтинги

Из этого набора данных мне нужно создать матрицу оценки пользовательского элемента, используя функцию «acast» в R. Но учитывая размер данных, которые я получаю ошибка:

Ошибка: не удалось выделить вектор 250 ГБ.

Есть ли обходной путь для этого шага или увеличение ОЗУ - единственный вариант?

ответ

0

Постарайтесь выполнить следующие действия: 1. Выберите только тех пользователей, у которых есть фактические оценки предметов (рекомендуется некоторые предметы/ранжировать их). Таким образом, вы будете работать только с реальными ценными данными. 2. Если набор данных с шага 1 по-прежнему слишком велик, выберите из него случайных пользователей N (10000, 20000) с соответствующими рейтингами

+0

Есть ли какие-либо критерии, чтобы я мог следовать примеру клиентов. Все клиенты оценили какой-то предмет или другой, но очень немногие должны были оценить аналогичные товары. – TUSHAr

+1

Выберите ценное количество (10000, 20000) клиентов с максимальным количеством номинальных позиций. Как правило, вам не нужно обрабатывать всех своих клиентов, чтобы получить рабочий механизм рекомендаций. –