У меня есть следующие: Источник - Кафка тема (транс) канал - память Раковина - HDFS (avro_event)Кафка с Avro записей
Данные в этой теме Кафка транс был написан с использованием переменного тока # производитель и имеет тысячи записей об Avro. Когда я запускаю своего потребителя дымохода, он начинает топить данные в hdf. Проблема заключается в том, что данные в формате: Схема данных схемы данные
вместо:
схема данных данные
Я предполагаю, что это происходит потому, что лотковый ожидает тип записи с {header} {body}, тогда как данные, поступающие из kafka, будут {body} . Я знаю, что вы можете обернуть данные avro, которые были записаны в тему в avroFlumeEvent, но тогда кажется, что это уже не истинный рекорд Avro и, возможно, искровой потребитель или шторм предпочтут t он данные в истинном avro вниз по линии. Есть ли способ обработать эту тему, чтобы данные записывались без использования нескольких схем каждый раз, когда лоток загружает данные в hdfs?