У меня есть несколько файлов с данными.
Например: file01.csv
с x
lignes in it, file02.csv
с y
линии в нем.Получите имена и содержимое файлов, а затем слейте их в другой файл с mapreduce
Я хотел бы, чтобы лечить и объединить их с MapReduce, чтобы получить файл с x
строки, начинающиеся с file01
затем содержимого строки и y
файлы, начинающиеся с file02
затем содержимого строки.
У меня есть два вопроса здесь:
- Я знаю, как получить строки из файла с MapReduce, установив
FileInputFormat.setInputPath(job, new Path(inputFile));
Но я не понимаю, как я могу получить строки каждого файла в папке. - Как только у меня есть эти строки в моем картографе, как я могу получить доступ к соответствующему имени файла, чтобы я мог создавать нужные данные?
Благодарим вас за рассмотрение.
Ambre
Проверьте, если это поможет вам - http://stackoverflow.com/questions/17875277/reading-file-as-single-record-in-hadoop – Amit