0

У меня есть несколько вопросов о Кафке. Если кто-то может мне помочь, отвечая на одного из них, я буду очень благодарен.Kafka Cluster - производитель

Спасибо заранее :)

Q1) Я знаю, что разделы разбиты на Кафка Брокер. Но раскол основан на чем?. Например, если у меня есть 3 брокера и 6 разделов, как обеспечить, чтобы у каждого брокера было 2 раздела? Как этот раскол в настоящее время производится в Кафке?

Q2) Когда производитель отправляет новое сообщение, какой идентификатор используется по умолчанию для сообщения? Avro формат? Как изменить этот формат по умолчанию на другой формат, который может быть более подходящим, например?

Q3) Я знаю, что для настройки максимального размера файла (сегмента журнала) в разделе мне необходимо изменить следующую конфигурацию: log.segment.bytes (по умолчанию 1G). Но какой параметр конфигурации мне нужно изменить, чтобы увеличить/уменьшить максимальный размер каталога (т. Е. Раздела)?

Q4) Если раздел считается лидером, мертвый, один из разделов последователя будет играть главную роль. Каков шаг, чтобы выбрать нового лидера? (i.e) Из чего сделан выбор нового лидера?

Q5) Каков параметр конфигурации, который позволяет мне изменять время между двумя дисками? (сохраняются данные на диске - последовательная запись)

Q6) Как сообщение отправляется с жесткого диска Глава брокера Kafka для потребителя Kafka? Каково взаимодействие между Kafka Broker и Zookeeper? Это Zookeeper, который отправляет сообщение потребителю или Kafka Broker?

Спасибо заранее,

+0

Было бы полезно, если бы вы могли разделить этот вопрос, чтобы на них можно было ответить индивидуально на Stackoverflow. –

ответ

1

Q1: см How Partitions are split into Kafka Broker?

Q2: Брокеры агностик формату сообщения - они относятся сообщения равнинной массивы байтов. Таким образом, он может обрабатывать любой формат сообщения, который вы хотите иметь. Формат определяется в вашем собственном коде - выбирайте все, что хотите, и просто предоставляйте соответствующему де/сериализатору производителю/потребителю.

Q3: Темы и, следовательно, разделы либо усекаются после согласованного времени хранения (log.retention.ms), либо если они превышают log.retention.bytes. Кроме того, темы могут быть уплотнены, чтобы избежать бесконечного роста. (см. log.cleanup.policy)

Q4: Для выбора лидеров используется Apache Zookeeper.

Q5: Не понимаю вопроса.

Q6: ZK используется только для поддержки метаданных (какие темы существуют, например,). ZK не участвует в какой-либо фактической передаче данных между клиентом и брокером. Kafka использует собственный сетевой протокол. См. Wiki для Kafka для получения дополнительной информации: https://cwiki.apache.org/confluence/display/KAFKA/Index

 Смежные вопросы

  • Нет связанных вопросов^_^