Я использую Mapper для загрузки большого количества данных, которые имеют время выполнения и большой запрос, связанный с ним .. Мне просто нужно найти 1000 самых дорогих запросов , поэтому я пишу время выполнения как ключ к выводу моего картографа. Я использую 1 редуктор и хочу записать только 1000 записей, а редуктор - прекратить обработку.В MapReduce как остановить редуктор после обработки записей X
я могу иметь глобальный счетчик и сделать это если (количество < 1000) { context.write (ключ, значение) }
Но это все равно будет загружать все миллиарды записей, а потом не писать их.
Я хочу, чтобы редуктор остановился после плевки 1000 записей. Там, избегая времени поиска и времени чтения для следующего набора записей.
Возможно ли это?
Удивительно это сработало .. спасибо ... – mm93rc213v