Я использую HTTP-источник для размещения файлов JSON в HDFS (Single SANDBOX).Создание файла в HDFS, но не добавление какого-либо содержимого
Файл создан в правильной директории, однако в файл ничего не добавлено. Не могли бы вы проверить мой flume.conf, прежде чем начать отладку HTTP-источника?
#################################################################
# Name the components on this agent
#################################################################
hdfs-agent.sources = httpsource
hdfs-agent.sinks = hdfssink
hdfs-agent.channels = channel1
#################################################################
# Describe source
#################################################################
# Source node
hdfs-agent.sources.httpsource.type = http
hdfs-agent.sources.httpsource.port = 5140
hdfs-agent.sources.httpsource.handler = org.apache.flume.source.http.JSONHandler
#################################################################
# Describe Sink
#################################################################
# Sink hdfs
hdfs-agent.sinks.hdfssink.type = hdfs
hdfs-agent.sinks.hdfssink.hdfs.path = hdfs://sandbox:8020/user/flume/node
hdfs-agent.sinks.hdfssink.hdfs.fileType = DataStream
hdfs-agent.sinks.hdfssink.hdfs.batchSize = 1
hdfs-agent.sinks.hdfssink.hdfs.rollSize = 0
hdfs-agent.sinks.hdfssink.hdfs.rollCount = 0
#################################################################
# Describe channel
#################################################################
# Channel memory
hdfs-agent.channels.channel1.type = memory
hdfs-agent.channels.channel1.capacity = 1000
hdfs-agent.channels.channel1.transactionCapacity = 100
#################################################################
# Bind the source and sink to the channel
#################################################################
hdfs-agent.sources.httpsource.channels = channel1
hdfs-agent.sinks.hdfssink.channel = channel1
Сейчас я просто пытаюсь проверить это, начиная с малого:
[{"text": "Hi Flume this Node"}]
Так что я имею в виду мой BATCHSIZE/rollSize/rollCount может быть проблема здесь?
Является ли этот пользовательский обработчик, только что помещенный в каталог flume? Как его поднять? – pele88
Скомпилируйте его и поместите в банку, эту банку нужно поместить в ваш каталог FLUME_HOME/lib. Изменение hdfs-agent.sources.httpsource.handler указывает на вашу собственную реализацию. –