Я использую кластер hadoop (версия 1.2.0) из 16 узлов, один с открытым IP-адресом (master) и 15, подключенный через частную сеть (ведомые устройства).Хранение промежуточного вывода mapreduce на удаленном сервере
Возможно ли использовать удаленный сервер (в дополнение к этим 16 узлам) для хранения выходных данных микропроцессоров? Проблема заключается в том, что в течение фазы отображения на диске заканчивается дисковое пространство, и я больше не могу сжимать вывод карты.
Я знаю, что mapred.local.dir
в mapred-site.xml
используется для установки списка разделов, разделенных запятыми, где хранятся файлы tmp. В идеале, я хотел бы иметь один локальный каталог (по умолчанию) и один каталог на удаленном сервере. Когда локальный диск заполняется, я хотел бы использовать удаленный диск.
+1 для двух свойств, которые действительно очень полезны. Благодаря! Я посмотрю на них глубже. Я уже знал первую часть ответа, мой вопрос - как это сделать. – vefthym