Я пытаюсь создать систему рекомендаций, основанных на элементах, из набора данных yelp. Мне удалось обработать данные до такой степени, что у меня есть рейтинги, данные всеми пользователями, которые рассматривали ресторан в определенном состоянии. В конце концов я хочу дойти до того, что у меня есть рейтинговая матрица с ресторанами на одной оси, а пользователи - с другой, и рейтинги (1-5) посередине (ноль для отсутствующих отзывов).Переупорядочить рамку данных pandas, чтобы создать матрицу оценок 2d
Сейчас DF выглядит следующим образом:
user_id review_id business_id stars
0 Xqd0DzHaiyRqVH3WRG7 15SdjuK7DmYqUAj6rjGowg vcNAWiLM4dR7D2nwwJ7nCA 5
1 Xqd0DzHaiyRqVH3WRG7 15SdjuK7DmYqUAj6rjGowg vcNAWiLM4dR7D2nwwJ7nCA 5
2 H1kH6QZV7Le4zqTRNxo RF6UnRTtG7tWMcrO2GEoAg vcNAWiLM4dR7D2nwwJ7nCA 2
3 zvJCcrpm2yOZrxKffwG -TsVN230RCkLYKBeLsuz7A vcNAWiLM4dR7D2nwwJ7nCA 4
4 KBLW4wJA_fwoWmMhiHR dNocEAyUucjT371NNND41Q vcNAWiLM4dR7D2nwwJ7nCA 4
5 zvJCcrpm2yOZrxKffwG ebcN2aqmNUuYNoyvQErgnA vcNAWiLM4dR7D2nwwJ7nCA 4
6 Qrs3EICADUKNFoUq2iH _ePLBPrkrf4bhyiKWEn4Qg vcNAWiLM4dR7D2nwwJ7nCA 1
, но я хотел бы, чтобы она выглядела немного больше, как это:
(4 ресторана х 5 пользователей)
0 4 3 4 5
3 3 3 2 1
1 2 3 4 5
0 5 3 3 4
Было бы лучше, если бы вы включили здесь пример, пригодный для копирования. Вам нужно что-то вроде стержня, но набор данных yelp действительно разрежен, поэтому у вас могут быть проблемы с памятью. Эта структура может быть более подходящей. – ayhan
Как вместо ссылки на изображение? Я не уверен, как, но я могу попробовать – mmera
Я думаю, что лучший пример с фиктивными данными, такими как 'df = pd.DataFrame ({'A': ['a', 'b', 'c', 'c'] , 'B': ['g', 'h', 'f', 'p'], 'C': [7,8,9,1]}) ', попробуйте изменить, если потребуется. Также не забудьте добавить желаемый результат. – jezrael