Первый вопрос: Я хочу знать, будут ли сплиты менять блоки любыми способами (т. Е. Изменить размер, переместить блок в другое место, создать новые блоки, ...).Разделяют ли расколы, такие как FileSplit в Haddop, блоки?
Второй вопрос: Я думаю, шпагат не меняет блоки, но он определяет, где каждый MapTask должен существовать и работать на кластере для локальности данных или осведомленности стойки, поскольку узлы DataNode уже работает и имеющие блоки поэтому расщепления, которые, я думаю, скажу Hadoop, чтобы запустить MapTask рядом с узлом, который содержит данные. Примечание. Внутри InputSplit есть Location/Host, который я думаю для этой цели. Пожалуйста, поправьте меня, если я ошибаюсь
Третьи вопросы: Изначально перед непосредственным выполнением задачи, будут блоки двигаться туда, где MapTask является или MapTask будет двигаться туда, где блоки (т.е. Расположение DataNode)?
Великий ответ, спасибо. –