У меня есть один вопрос, касающийся HDFS процесса чтения/записи:Может ли процесс чтения/записи HDFS быть приостановлен/возобновлен?
Если предположить, что у нас есть клиент (для примера скажем, что клиент является процессом карты Hadoop), который просит, чтобы прочитать файл из HDFS и или записать файл в HDFS, , который является процессом, который фактически выполняет чтение/запись с/на HDFS?
Я знаю, что есть процесс для Namenode и процесс для каждого Datanode, каковы их обязанности перед системой в целом, но я смущен в этом сценарии.
Это сам процесс клиента или есть другой процесс в HDFS, созданный и выделенный для этого конкретного клиента, для доступа и чтения/записи с/на HDFS?
И наконец, , если второй ответ верен, существует ли вероятность того, что этот процесс может быть приостановлен на некоторое время?
Я провел некоторое исследование, и самые важные решения, которые я нашел, были Oozie и JobControl класс от hadoop API.
Но, поскольку я не уверен в описанном выше рабочем процессе, я не уверен, какой процесс я приостанавливаю и возобновляю с помощью этих инструментов.
Это процесс или процесс клиента, который работает в HDFS для обслуживания запроса клиента?
Спасибо за ваш ответ! Я не понимаю последнюю часть. Как насчет примера со вторым клиентом с более высоким приоритетом? – dinosaur
Теперь, когда я пытаюсь пересмотреть мой предыдущий ответ, может ли он работать с использованием очередей данных на основе этих двух сообщений? http://stackoverflow.com/questions/34464187/hadoop-file-write/34464676#34464676 http://stackoverflow.com/questions/32038000/hadoop-2-0-data-write-operation-acknowledgement – dinosaur
и озабоченность мой первоначальный пост: класс [JobControl] (https://hadoop.apache.org/docs/r2.5.2/api/org/apache/hadoop/mapreduce/lib/jobcontrol/JobControl.html) приостанавливает процесс клиента, а не право чтения/записи HDFS? Есть ли способ приостановить процесс чтения/записи HDFS? – dinosaur