Я создаю задание mapdo для Hadoop (0.20.1), которое использует HBase (0.20.1) как источник данных, так и приемник данных. Я хотел бы написать работу в Python, которая потребовала от меня использовать hasoop-0.20.1-streaming.jar для потоковой передачи данных в сценарии Python и из них. Это прекрасно работает, если источник данных/приемник - файлы HDFS.Hadoop mapreduce streaming from HBase
Поддерживает ли поддержка Hadoop от/до HBase для mapreduce?
ли вы взглянули на Hbase + Кафка + Спарк Streaming интеграции? – Mike