1

Я работаю над механизмом рекомендаций, который использует элементный фильтр для создания рекомендаций для ресторанов. В каждом ресторане есть отзывы с рейтингом от 1 до 5.
Каждый алгоритм рекомендаций борется с проблемой разреженности данных, поэтому я искал решения для расчета правильной корреляции.Минимальный объем данных для элементарного фильтра совместной работы

Я использую настроенное сходство косинусов между ресторанами.

Если вы хотите вычислить сходство между ресторанами, вам нужны пользователи, которые оценили оба ресторана. Но каков был бы минимум пользователей, которые оценили оба ресторана, чтобы получить правильную корреляцию?

Из тестирования я обнаружил, что 1 набор пользователей, которые оценили оба ресторана, имеют плохое сходство (очевидно). Часто это -1 или 1. Поэтому я увеличил его до 2-х пользователей, у которых есть оба ресторана, что дало мне больше общего. Мне просто сложно определить, достаточно ли это сходство. Есть ли метод, который либо проверяет точность этого сходства, либо содержит рекомендации о том, каков минимальный?

ответ

0

Короткий ответ - это параметр развертки: попробуйте несколько значений «минимальных пользователей, которые оценили оба ресторана» и измеряют результаты. С большим количеством пользователей вы сможете лучше понять сходство между пунктами (ресторанами). Но ваша информация о сходстве будет более низкой. То есть, вы сосредоточитесь на более популярных предметах и ​​сможете меньше рекомендовать элементы в длинном хвосте. Это означает, что у вас всегда будет компромисс, и вы должны измерить все, что позволит вам сделать компромисс. Например, измерьте прогностическую точность (например, RMSE), а также количество пунктов, которые можно рекомендовать.

Если ваше место на диске становится слишком редким, возможно, вам захочется найти другие способы, чтобы подобрать подобие товара за пределами оценок пользователей. Например, вы можете использовать методы фильтрации на основе контента, чтобы включать информацию о кухне каждого ресторана, а затем создать промежуточный шаг, чтобы узнать предпочтения кухни каждого пользователя. Это позволит вам делать рекомендации, даже если у вас нет баллов подобия предметов.

 Смежные вопросы

  • Нет связанных вопросов^_^