Один поток будет читать только из одной секции. Для чтения из нескольких разделов вам нужно создать несколько потоков, и каждый поток будет считываться из одного раздела. Вы должны запускать это в другом потоке, иначе вы потеряете преимущества наличия разделов, и ваша производительность будет хитом.
Для стартера вы можете запускать всех потребителей на одной машине. Но в конечном итоге вам придется начать использовать разные машины для потребления. В то время вам нужно обеспечить, чтобы один раздел обрабатывался только один раз. Конкретно, проблема, которую вам нужно решить, состоит в том, что 2 потока (из разных) пытаются прочитать из одного раздела. Во все времена, вы должны разрешить только один обработать его.
Кроме того, вам необходимо управлять смещениями. Вам нужно регулярно смывать их в зоопарке.
Предлагаю вам использовать High Level Consumer. Это намного проще в использовании, чем Simple Consumer. Он обеспечивает координацию между различными потоками, обращаясь к одному разделу, и управляет своими смещениями.
Почему это сложно? хеширование и т. д. все настроены, не так ли? – zinking