Я установил стабильную версию Hadoop 2.7.3. Я установил все переменные среды, такие как JAVA_HOME, HADOOP_HOME, PATH и т. Д. Я настроил файл yarn-site.xml, hdfs-site.xml, core-site.xml, mapred-site.xm
Задача: У меня довольно большие входные файлы (допустим, 50 ГБ каждый) на hdfs. Мне нужно сортировать их, хранить где-нибудь (программа драйвера/hdfs/что-то еще?), А затем перебирать их до тех пор, по
Я немного смущен о Как работает Mapreduce. Я прочитал несколько статей, но не получил правильного ответа. Сценарий: Я сохранил файл размер 1 Тб на вершине HDFS (Скажем, она хранится в местоположении/п