Заголовок вопроса объясняет все, что касается моего вопроса. я читал через несколько текстов, ответы, где я наткнулся на эту линиюВ hadoop, что подразумевается под умением сохранять состояние через редуктор Mapper несколькими входами?
Благодаря использованию объединителя и воспользовавшись возможностью сохранить состояние через несколько входов, часто можно существенно сократить и количество и размер пар ключ-значение, которые необходимо перетасовывать от преобразователей к редукторам.
Я не могу понять эту концепцию. Подробный ответ и объяснение с примером будут действительно полезными. Как развивать интуицию для понимания таких понятий?
Да. Я полностью понимаю, что вы говорите, но мой вопрос касается состояния ... Я не понимаю утверждения: способность сохранять состояние на нескольких входах .....? что это? где мы здесь поддерживаем? – neerajdorle
Или вы хотите сказать, что агрегирование, которое мы выполнили, поддерживало состояние? – neerajdorle
Ну, это немного связано с тем, как каркас сокращения каркаса работает внутри. Рамка создает экземпляр объекта Mapper, у которого есть определенный метод карты, но поскольку тот же объект Mapper применяет метод карты к нескольким парам ключ-значение во входном расщеплении, он способен сохранять состояние через несколько пар ключ-значение входы, простой пример этого состояния может быть счетчиком для каждого ключа, с которым он сталкивается. Он может даже загружать данные «состояния» во время «настройки» и сохранять его (или обновлять) на нескольких входах. –