У меня есть несколько (около дюжины) задач MapReduce, каждая из которых функционирует как часть рабочего процесса, выполняемого простым скриптом bash. По целому ряду причин я хотел бы переместить рабочий процесс в Apache Crunch.Как преобразовать существующие приложения MapReduce в Crunch?
Однако мне не ясно, как запустить мои задачи MapReduce как функции Crunch без их повторной реализации. Есть ли простой способ использовать функции Map и Reduce в качестве функций Crunch? Я хотел бы также поддерживать реализацию инструмента, так что задачи MapReduce могут выполняться как автономно, так и как часть рабочего процесса Crunch; Есть какой-либо способ сделать это?
Спасибо за понимание.