2017-01-31 17 views

ответ

1

GroupCombine используется в целях оптимизации. В отличие от GroupReduce, он не перетаскивает данные, а работает только на отдельных разделах. Это помогает уменьшить количество данных, которые будут отправлены для последующей операции сокращения. Говоря простыми словами, это операция локального сокращения.

Если вы знакомы с функциями «Уменьшить карту» в Hadoop, у нас также есть функция объединителя. Этот GroupCombine в Flink работает точно так же.

Здесь представлено визуальное представление Combiner в Hadoop.

enter image description here

Надеется, что это помогает!

 Смежные вопросы

  • Нет связанных вопросов^_^