У меня есть функция, которую нужно вызывать на большом количестве файлов (1000). Каждый из них независим от другого и может выполняться параллельно. Выход функции для каждого из файлов не нужно комбинировать (в настоящее время) с другими. У меня есть много серверов я могу масштабировать это на, но я не знаю, что делать:MapReduce или пакетное задание?
1) Запуск MapReduce на нем
2) Создание 1000-х рабочих мест (каждый из них имеет другой файл, он работает на).
Будет ли одно решение предпочтительнее другого?
Спасибо!
+1. В общем, вы хотите сделать простейшую вещь, которая будет хорошо работать для вашей проблемы. Настройка mapreduce для выполнения чего-то, что может быть выполнена с независимыми сценариями в независимых файлах, - указывает @PA, - излишне. Сказав это, если вы знаете, что хотите изучить MapReduce по какой-то другой причине, и вы хотите использовать эту более простую проблему в качестве отправной точки, перейдите к ней. Но я бы не рекомендовал его в этом случае. –