2017-02-18 27 views

ответ

1

Если вы используете Hadoop потоковый, то вы можете проверить свои скрипты локально, как это:

cat *.csv | map.py | sort -k1,1 | reducer.py 

Чтобы передать данные от преобразователя к редуктору в Hadoop-потоковом, просто написать "<key>\t<value>" на стандартный вывод

+0

Вот что я решил. Но вместо этого использовали sort -n – Shehryar