Я пытаюсь разобрать ниже входа (есть 2 записей в этом входе) с использованием JSon погрузчик Elephantbird [{ "node_disk_lnum_1": 36, "node_disk_xfers_in_rate_sum": +136,40000000000001» node_disk_bytes
У меня есть отношения с пиратским набора данных со следующими полями: date, country_code, torrent_id, first_seen, torrent_size, quality, movie_id, value
Я хочу, чтобы сгруппировать по дате, страной,
Я пытаюсь написать сценарий в PIG, и мне нужно сделать набор данных, содержащий идентификатор пользователя, дату, код страны и другие атрибуты ... мой разыскиваемый результат в группе по идентификатор
У меня 2 отношений: соотношение А: 101,Ankit-Reddy,08022017
102,Siddarth-Battacharya,08022017
103,Rajesh-Khanna,08022017
и связь Б: 102,Ronit-Roy,09022017
103,Ranveer-Singh,09022017
107,sadiya-s
У меня есть следующий набор данных, в котором мне нужно, чтобы выяснить минимальную дату из всех записей для каждого клиента (f1) и список из записей, дата которых больше мин даты f1 f2 f3
101 JOE