My DB выглядит, как это и представляет собой покупку, сделанное заказчиком на определенном магазине:сосчитать, сколько записей было в каждой группе в улье
Customer ID | Store ID | Date & Time
1 | 1884 | 2016-10-30 13:00:00
5 | 2001 | 2016-10-30 13:00:00
Набор данных очень велик. Время разнесено на 1 час.
Мне нужно подсчитать, сколько клиентов совершили покупку в течение каждого часа дня. Возвращенные данные должны выглядеть так:
Store ID | Unique Date & Time | Number of purchases
1884 | 2016-10-30 13:00:00 | 8
1884 | 2016-10-30 14:00:00 | 12
У меня нет идей и я буду благодарен за любую помощь, которую я могу получить.
это может столкнуться с проблемой с минутами и так секунд значение полосы в день и час, чтобы избежать проблем. –
По-прежнему не повезло, этот код возвращает счет для всех магазинов. Другими словами, он не сбрасывается при изменении идентификатора магазина. – saucypigeon
@promashk, вы можете добавить предложение where в конце первого запроса, упомянутого выше, которое ограничивает время до предыдущего часа. Теперь этот запрос должен запускаться каждый час дня, выход которого должен быть вставлен в таблицу say x. Теперь, когда вы запрашиваете данные из x на днях, ограничьте его только данными предыдущих дней. [Http://stackoverflow.com/questions/34757504/hive-how-to-calculate-time-difference] – kirtan