Я пытаюсь научиться использовать Python UDF с Hive.Использование Python UDF с улей
У меня есть очень простой питон UDF здесь:
import sys
for line in sys.stdin:
line = line.strip()
print line
Затем я добавляю файл в улье:
ADD FILE /home/hadoop/test2.py;
Теперь я называю Улья запрос:
SELECT TRANSFORM (admission_type_id, description)
USING 'python test2.py'
FROM admission_type;
Этот работает, как и ожидалось, никаких изменений в поле не производится, а выход печатается как есть.
Теперь, когда я изменяю UDF, вводя функцию split, я получаю ошибку выполнения. Как мне отлаживать здесь? и что я делаю неправильно?
Новая UDF:
import sys
for line in sys.stdin:
line = line.strip()
fields = line.split('\t') # when this line is introduced, I get an execution error
print line
Вуду. Иногда он терпит неудачу и иногда работает. –