вот некоторые фиктивные данные:R: вычислить число различных категорий в установленные сроки
user_id date category
27 2016-01-01 apple
27 2016-01-03 apple
27 2016-01-05 pear
27 2016-01-07 plum
27 2016-01-10 apple
27 2016-01-14 pear
27 2016-01-16 plum
11 2016-01-01 apple
11 2016-01-03 pear
11 2016-01-05 pear
11 2016-01-07 pear
11 2016-01-10 apple
11 2016-01-14 apple
11 2016-01-16 apple
Я хотел бы вычислить для каждого user_id
числа различных categories
в определенный период времени (например, в за последние 7, 14 дней), в том числе текущего заказа
решение будет выглядеть следующим образом:
user_id date category distinct_7 distinct_14
27 2016-01-01 apple 1 1
27 2016-01-03 apple 1 1
27 2016-01-05 pear 2 2
27 2016-01-07 plum 3 3
27 2016-01-10 apple 3 3
27 2016-01-14 pear 3 3
27 2016-01-16 plum 3 3
11 2016-01-01 apple 1 1
11 2016-01-03 pear 2 2
11 2016-01-05 pear 2 2
11 2016-01-07 pear 2 2
11 2016-01-10 apple 2 2
11 2016-01-14 apple 2 2
11 2016-01-16 apple 1 2
Я разместил похожие вопросы here или here, однако ни одна из них не ссылалась на подсчет совокупных уникальных значений за указанный период времени. Большое спасибо за вашу помощь!
Почему это начинается с '0'? – akrun
Это была моя опечатка, теперь исправленная, спасибо! –
Вы уверены, что значения в 'distinct_7' верны? Если я посмотрю 2016-01-10, должен ли он начинаться как новая группа. Кроме того, если вы посмотрите на значение 'distinct_7' для' user_id' 11, оно начинается с 0. – akrun