RDD
RDD
имеет очень полезную совокупность методов, которая позволяет накапливать нулевое значение и комбинировать его между разделами. Есть ли способ сделать это с помощью Dataset[T]
. Насколько я вижу спецификацию через Scala doc, на самом деле ничего не получается. Даже метод reduce позволяет делать вещи только для двоичных операций с T как оба аргумента. Почему? И если есть что-то способное сделать то же самое?Агрегация Spark Dataset, аналогичная агрегату RDD (ноль) (накопитель, сумматор)
Большое спасибо!
В.К.