2015-12-29 3 views
-1

Я ищу решение, которое поможет мне рекомендовать наиболее подходящие записи для моей существующей базы данных. Я считаю использование машинного обучения для этой задачи.Лучшее решение для машинного обучения для рекомендаций, основанных на параметрах

У меня есть набор данных, которые описывают выбор пользователя для фильмов: кино, возраст, пол, movie_rating (0-10) (в будущем будет больше параметров)

Тогда что я бы хотел бы get - это решение, которое помогает мне найти лучшие рекомендации по фильмам по параметрам. Таким образом, вход будет пользователем: 20 лет, мужчина, рейтинг фильма 8+

И в итоге я хотел бы получить лучшие подходящие фильмы для этого параметра.

Я рассматриваю решение регрессии, но, возможно, есть и другой способ сделать это.

ответ

0

Один из способов сделать это - использовать matrix factorization, чтобы найти недостающие значения для матрицы. Для вашей проблемы у многих пользователей нет рейтингов фильмов для многих фильмов в базе данных. Таким образом, вы можете использовать матричную факторизацию для заполнения (приблизительной) этой матрицы, а затем, основываясь на оценках, полученных для разных фильмов, порекомендует фильмы пользователям.

0

Для удобства используйте Naive Bayes. Это даст вам до 80% + точность в тестах, а для таких вещей, как рекомендации к фильмам, это не так легко проверить на 100%.

3

Для вашей проблемы нет прямого алгоритма, потому что вы добавляете в нее несколько функций, таких как возраст, пол, рейтинг. Для достижения своей цели вы можете использовать несколько алгоритмов малой матрицы с низким рейтингом, таких как SVD или ALS, чтобы найти недостающие значения для матрицы (совместная фильтрация). Затем вам необходимо применить классификационный алгоритм для классификации фильмов с рейтингом 8+ с возрастом (20 +), сексом (мужчина) и взять точку пересечения.