я планирую следующее поколение системы анализа я разрабатываю, и я думаю о его реализации с помощью одного из MapReduce
/Stream-Processing
платформ, таких как Flink
, Spark Streaming
и т.д.DB доступ из Mapper в MapReduce
Для анализа , у картографов должен быть доступ к БД.
Так что моя самая большая забота - когда сопоставлен сопоставитель, все соединения из пула подключений будут использоваться, и может возникнуть сопоставление, которое не сможет получить доступ к БД.
Как мне с этим справиться? Это что-то, о чем я должен беспокоиться?
Я исхожу из фона искры. Я думаю, вам следует избегать предоставления доступа к базе данных «mappers», что вызывает сложность и, на мой взгляд, не лучший подход к анализу параллельных данных (по крайней мере, с искрыми). Вы изучаете лучший способ получить данные в своем аналитическом конвейере? – ImDarrenG
Для чего вам нужен доступ к БД в ваших вычислительных процессах? Прием данных? Погляди? – LiMuBei
@ImDarrenG, Да, я изучаю лучший способ получить данные в конвейере анализа. и @ LiMuBei, мне нужно обработать много данных от многих датчиков, каждый образец нужно обрабатывать с использованием метаданных из БД (которые могут время от времени меняться, в противном случае я бы кэшировал все данные из БД в каждом преобразователе) –