Я немного смущен о Как работает Mapreduce. Я прочитал несколько статей, но не получил правильного ответа.Выполнение Mapreduce в кластеле hadoop
Сценарий:
Я сохранил файл размер 1 Тб на вершине HDFS (Скажем, она хранится в местоположении/пользователе/входе /). Репликация - 3, а размер блока - 128 МБ.
Теперь я хочу проанализировать этот 1TB-файл, используя mapreduce. Поскольку размер блока составляет 128 Мбайт, у меня будет всего 8192 блоков. Учитывая, что у меня есть 100 машин в кластере, тогда
Будет ли задание на карту 8192 отображено на всех 100 узлах, равномерно распределяя количество картографов? Или он будет работать только на тех узлах, где размещены реплицированные данные?
Спасибо Rabindra. Хорошие объяснения – Rahul