Что такое хороший метод назначения работы множеству удаленных компьютеров? Рассмотрим пример, когда задача очень интенсивно связана с процессором и оперативной памятью, но фактически не обрабатывает большой набор данных. Языком выбора будет Java. Я думал, что Hadoop будет хорошим вариантом, но набор данных, передаваемый между удаленными машинами, довольно мал, и Hadoop, похоже, сосредоточен главным образом на распределении данных, а не на распределении работы.Как распараллеливать выполнение на удаленных системах
Какие хорошие технологии могут помочь?
EDIT: меня интересует в основном балансировка нагрузки. Будет выполнен ряд рабочих заданий с небольшим (< 3MB) набором данных, но для этого необходимы значительная обработка и память.
Кто-то еще в моей команде упомянул RMI. Мне нравится идея «тянуть»! Думаю, я поеду по этому маршруту. Благодаря! – User1