Мне нужно вычислить, имеют кванты искры на числовом поле после группа по операции. Есть ли способ применить approxPercentile в сводном списке вместо столбца?Spark Dataframe вычисление процентиля на массиве
E.g. Dataframe выглядит как
k1 | k2 | k3 | v1
a1 | b1 | c1 | 879
a2 | b2 | c2 | 769
a1 | b1 | c1 | 129
a2 | b2 | c2 | 323
мне нужно сначала запустить groupBy (k1, k2, k3)
и collect_list(v1)
, а затем вычислить quantiles [10th, 50th...]
на список v1-х