Я пытаюсь написать PIG UDF для нижеприведенного входного файла образца, и я также указываю ожидаемый результат. Пожалуйста, помогите мне с шаблоном udf для того же или дайте мне знать, есть ли способ сделать это без UDF.Как написать PIG UDF для данных с разделителями вкладок и добавить метку времени с левой стороны?
моего образец ввод:
2014-01-23T08:12:09.259443
Device Type make year
-- ------------ --------- --------------------------------------- -------------
desktop commercial hp 2010
laptop commercial Asus 2013
mobile personal Sony 2014
2015-01-15T08:12:09.259443
Device Type make year
-- ------------ --------- --------------------------------------- -------------
desktop commercial hp 2015
laptop commercial Asus 2016
mobile personal Sony 2013
Я в основном нужен выход в качестве метки времени следует поля в разделителях отделенной моды, разделитель может быть «„“\ т», „|“. для этого экземпляра я использую «,» как разделитель.
Ожидаемый результат:
2014-01-23T08:12:09.259443, desktop, commercial, hp, 2010
2014-01-23T08:12:09.259443, laptop, commercial, Asus, 2013
2014-01-23T08:12:09.259443, mobile, personal, Sony, 2014
2015-01-15T08:12:09.259443, desktop, commercial, hp, 2015
2015-01-15T08:12:09.259443, laptop, commercial, Asus, 2016
2015-01-15T08:12:09.259443, mobile, personal, Sony, 2013
Примечание: Я не могу сделать предварительную обработку, поскольку есть некоторые ТБ-файлов
Что вы устали до сих пор? – bartektartanus
@bartektartanus Спасибо, но я смог проанализировать его успешно. –