2017-01-29 7 views
0

В одном из научно-исследовательских работ по MapReduce, есть предложение:Как повторное выполнение будет основным источником отказоустойчивости?

Наше использование функциональной модель с заданным пользователем картой и сократить операции позволяет распараллелить большие вычисления легко и использовать повторное выполнение в качестве основной механизм отказоустойчивости.

Я не понял, что такое повторное выполнение и как повторное выполнение может быть основным механизмом отказоустойчивости?

+1

Можете ли вы, пожалуйста, поделиться ссылкой на исследовательский документ здесь. Это исследовательская работа j dean –

+0

@siddharthajain URL-адрес исследовательской статьи: https://static.googleusercontent.com/media/research.google.com/en//archive/mapreduce-osdi04.pdf – Gokul

ответ

1

Я хотел бы дать общий ответ.

Причины неисправностей или отказов:

  1. Узел отказа/недостижим Другими словами, это означает, что все задачи, выполняющиеся в этом узле не удалось/пошел недостижим.

  2. Неисправность/недоступность задачи Данные, обрабатываемые всеми задачами внутри узла, будут сохраняться локально, а когда узел выходит из строя или становится недоступным (другим узлам или ведущим), то нет способа получить данные, обработанные до сих пор. Таким очевидным решением является перезапуск этих задач на том же узле или в некоторых других узлах (сбой узла). Это делает повторный запуск основного механизма отказоустойчивости.

Другая аналогия переоформления для отказоустойчивости является избыточность для потери данных. Данные дублируются, чтобы избежать потери данных устройствами хранения. Аналогичным образом, задачи выполняются повторно, чтобы сделать приложения уязвимыми.