2017-01-25 13 views
0

У меня есть 10 узлов данных, коэффициент репликации равен 3, размер файла - 150, а размер блока - 64. Таким образом, файл будет разбиваться на три блока B1, B2, B3. Таким образом, клиент запрашивает имя узла для доступности узлов данных для записи блока B1. Мой вопрос в том, сколько узлов данных будет предоставлено клиенту узлом Name для записи блока B1. И еще один вопрос заключается в том, как пишет для B1, B2, B3 будет случилось либо параллельно, либо последовательноКак имя узла обновляет доступность Узлов данных для записи HDFS в Hadoop

+0

Есть конкретная проблема, вы сталкиваясь/пытаетесь решить? Кажется, вы просто просите о том, как работает Hadoop. – flyingmeatball

ответ

2
  1. данные будут записаны только один DataNode клиентом, тиражирование остальное позаботилась самой DataNodes на инструкции наменования. Replica placement: в то время как дататод принимает данные блока от клиента, datanode сохраняет данные в файле, который представляет блок, и одновременно пересылает данные в другой datanode, который должен создать другую реплика блок.

  2. блоки копируются последовательно

+0

Блоки B1, B2, B3 будут храниться последовательно или параллельно? Я имею в виду, что сначала B1 хранится в следующем B2, а затем B3? –

+0

Последовательность, как я написал в ответе выше –