from mrjob.job import job
class KittyJob(MRJob):
OUTPUT_PROTOCOL = JSONValueProtocol
def mapper_cmd(self):
return "grep kitty"
def reducer(self, key, values):
yield None, sum(1 for _ in values)
if __name__ == '__main__':
KittyJob().run()
Источник: https://mrjob.readthedocs.org/en/latest/guides/writing-mrjobs.html#protocolsОбъяснения этого примера MRJob
Как этот код делать свою задачу подсчета числа строк, содержащих котенок?
И где определяется OUTPUT_PROTOCOL?