У меня есть исходный идентификатор клиентов таблицы, поступающий в магазин за определенный период времени. Используя Impala, я хотел бы рассчитать количество различных идентификаторов клиентов, поступающих в магазин до каждого дня. (Например, на 3-й день, 5 различных клиентов посетили до сих пор)Как получить количество различных значений до периода Impala/SQL?
Вот простой пример необработанного таблицы у меня есть:
Day ID
1 1234
1 5631
1 1234
2 1234
2 4456
2 5631
3 3482
3 3452
3 1234
3 5631
3 1234
Вот что я хотел бы получить:
Day Count(distinct ID) until that day
1 2
2 3
3 5
Есть ли способ легко сделать это в одном запросе?
'(например, на 3-й день, 5 различных клиентов посетили до сих пор)' идентификатор представляет собой право клиента? Как вы можете сказать, что 5 различных клиентов посетили магазин, когда 1234 дважды посетили в день 3. Вы ожидали, что результаты действительно не соответствуют тому, что вы пытаетесь сказать. – brenners1302
С самого начала (с 1-го дня до 3-го дня) вам нужно только один раз подсчитать клиента 1234. Я ищу счет (отдельный идентификатор) до 3-го дня – KTY
Тогда счет на 2-й день должен быть 1. и на третий день счет должен быть 2. Вот почему я говорю, что ожидаемые результаты не соответствуют тому, что вы пытаетесь сказать. – brenners1302