Я просто хотел получить более подробное описание ниже. Когда я попытался понять how the HDFS writes happens to Data nodes. Я получил ниже объяснение о записи HDFS.Трубопровод данных в Hadoop HDFS при копировании файлов в DataNodes
Почему клиент hdfs отправляет 4kb в узлы данных вместо отправки всего блока 64 МБ на узел данных? Может ли кто-нибудь объяснить подробно?
Для повышения производительности узлы данных поддерживают конвейер для передачи данных. Узлу данных 1 не нужно ждать завершения полного блока, прежде чем он сможет начать передачу в узел данных 2 в потоке. Фактически, передача данных от клиента к узлу данных 1 для данного блока происходит в меньших кусках 4 КБ. Когда узел данных 1 получает первый клиент из 4KB от клиента, он сохраняет этот фрагмент в своем локальном репозитории и сразу же начинает передачу его в узел данных 2 в потоке. Аналогично, когда узел данных 2 принимает первый блок 4KB из узла данных 1, он сохраняет этот фрагмент в своем локальном репозитории и немедленно начинает его перенос на узел данных 3. Таким образом, все узлы данных в потоке, кроме последнего, принимают данные из предыдущий и перенести его на следующий узел данных в потоке, чтобы улучшить производительность записи, избегая времени ожидания на каждом этапе.
Вы можете добавить источник контента, который разместили на сайте? – mrsrinivas
http://www.informit.com/articles/article.aspx?p=2460260&seqNum=2. –