Folks,Spark: Изменить CSV файл и записать в другую папку
У нас есть одно требование, где мы хотели сделать незначительные преобразования на CSV файл и записать то же самое в другую папку для HDFS с помощью искры.
/input/csv1.txt например (ГБ файла по меньшей мере, 4)
ID,Name,Address
100,john,some street
выход должен быть в файле (выход/csv1.txt). В основном две новые колонки будут добавлены после анализа адреса (Порядок записи должен быть таким же, как входной файл)
ID,Name,Address,Country,ZipCode
100,Name,Address,India,560001
Похоже, что нет легко сделать это с помощью искры.
Привет, Мы попытались запустить это, но мы получаем файлы PART (part-00000) в выходном каталоге. Вместо этого нам нужно получить имя файла, как в выходном каталоге. –