Извините, что я новичок в Apache Nifi. Поэтому я сделал поток данных о том, как вытащить данные из Hive и сохранить их в SQL. В моем потоке данных нет ошибки, единственной проблемой является ее вытягивание данных повторно.Вытащить данные из улья на SQL Server без дубликатов с помощью Apache Nifi
Мой поток данных состоит из следующего:
- SelectHiveQL
- SplitAvro
- ConvertAvroToJson
- ConvertJsonTOSQL
- PutSQL
Например мой стол в улье есть только 20 строк, но когда я запускаю поток данных и проверить мой стол в MS SQL. Он сохранил 5000 строк. SelectHiveQL несколько раз вытаскивал данные.
Что мне нужно сделать, он будет тянуть только 20 строк или просто точное количество строк в моей таблице улья?
Спасибо
Большое вам спасибо, сэр !! – Eiger