2017-02-06 5 views
2

Я думал, можно ли почерпнуть каталог на hdfs, а затем привести его в локальную систему. Есть ли способ сделать это?Можем ли мы заархивировать каталог в hdfs?

Любая помощь будет оценена по достоинству.

спасибо.

+0

Что вы подразумеваете под zip-файлом, например, в файле результатов с HDfS ?? –

ответ

2

Вы можете создать таблицу улого & сделать вставку перезаписи после установки следующих свойств:

set mapred.output.compress=true; 
set hive.exec.compress.output=true; 
set mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec; 
set io.compression.codecs=org.apache.hadoop.io.compress.GzipCodec; 

Но лучше подход включить сжатие в работе, которая создает файлы в первую очередь.

ПРИМЕЧАНИЕ: Хотя я назвал сжатие как Gzip, лучше использовать какой-то расщепляемый кодек, например snappy или lzo.

+0

Спасибо за ваш ответ, но я пытаюсь закрепить здесь каталог. Не файл. –