Может ли кто-нибудь предоставить некоторый свет на практические применения GroupCombine Grouped Dataset в Apache flink.Usecases для GroupCombine in flink
0
A
ответ
1
GroupCombine используется в целях оптимизации. В отличие от GroupReduce, он не перетаскивает данные, а работает только на отдельных разделах. Это помогает уменьшить количество данных, которые будут отправлены для последующей операции сокращения. Говоря простыми словами, это операция локального сокращения.
Если вы знакомы с функциями «Уменьшить карту» в Hadoop, у нас также есть функция объединителя. Этот GroupCombine в Flink работает точно так же.
Здесь представлено визуальное представление Combiner в Hadoop.
Надеется, что это помогает!