Моей искры потоковой работы потребляющих данных от КафкиКафки потреблять только новые сообщения
KafkaUtils.createStream(jssc, prop.getProperty(Config.ZOOKEEPER_QUORUM),
prop.getProperty(Config.KAFKA_CONSUMER_GROUP), topicMap);
всякого раза, когда я перезапустить свою работу она начать потребляющую от последнего смещения магазина (я предполагаю, что это потому, что это занимает много времени, чтобы отправьте обработанные данные, и если я изменю группу потребителей, она мгновенно работает с новым сообщением)
Я kafka 8.1.1, где auto.offset.reset по умолчанию является самым большим, что означает, что когда я перезапущу kafka, вы отправите данные откуда Я ушел.
В моем случае использования прошу меня игнорировать эти данные и обрабатывать только поступающие данные. Как я могу достичь этого? любое предложение
я найти еще один подход Спарк 1.5 (я проверял), использовать Кафка прямой апи и не использовать контрольно-пропускные пункты. –