У меня есть таблица со следующими столбцами.Hive Data, выбирающий последнее значение на основе временной отметки
C1,C2,Process TimeStamp,InsertDateTimeStamp
p1,v1,2014-01-30 12:15:23,2013-10-01 05:34:23
p1,v2,2014-01-31 05:11:34,2013-12-01 06:12:31
p1,v3,2014-01-31 07:16:05,2012-09-01 07:45:20
p2,v4,2014-02-01 09:22:52,2013-12-01 06:12:31
p2,v5,2014-02-01 09:22:52,2012-09-01 07:45:20
Теперь я хочу, чтобы принести уникальную строку для каждого первичного ключа на основе последних Process TimeStamp
.
Если Process TimeStamp
- это то же самое, что и ряд, имеющий последние InsertDateTimeStamp
.
Итак, мой результат должен быть.
p1,v3,2014-01-31 07:16:05,2012-09-01 07:45:20
p2,v4,2014-02-01 09:22:52,2013-12-01 06:12:31
Как достичь этого через HiveQL?
В настоящее время я использую улей 0.10. Я не могу использовать подзапрос с IN или EXISTS.
Спасибо.
Спасибо. Работает :) – jigarshah