Я хочу объединить 2 файла bzip2'ed. Я попытался добавить один к другому: cat file1.bzip2 file2.bzip2 > out.bzip2
, который, кажется, работает (этот файл распакован правильно), но я хочу использовать этот файл в качестве входного файла Hadoop, и я получаю ошибки о поврежденных блоках.Как слить 2 файла bzip2'ed?
Каков наилучший способ объединить 2 файла bzip2'ed без их распаковки?
Файлы с Bzipped разделены правильно, но я все еще не могу понять, как выполнять задачу карты в конкатенированных файлах. (Но после распаковки всех из них, тогда 'cat', а затем сжимает этот большой файл ввода работает) – wlk