Я пытаюсь загрузить файл CSV с помощью Pig
, но CSV-файл уже содержит «запятые» в некоторых столбцах, поэтому использование PigStorage (',') дает мне неправильные ответы.Загрузить CSV с помощью Pig
Я уже пробовал эти:
REGISTER /......./piggybank.jar
LOAD '...PATH_TO_INPUT_FILE' USING CSVLoader(',') AS (...fieldnames)
и
LOAD '...PATH_TO_INPUT_FILE' USING CSVExcelStorage(',') AS (...fieldnames)
И все они не дают желаемого результата. Запись, которая не содержит запятой в своих значениях, они работают нормально, но остальные из них не являются.
Вы можете разместить несколько входных строк из набора данных, которые вы пытаетесь обработать? – CodeReaper
Итак, у вас есть файл CSV со значениями, разделенными запятой, но некоторые из значений содержат запятые и не экранируются каким-либо образом? Если это так, у вас проблемы ... – LiMuBei