мне нужно что-то похожее на функцию randomSplit:Split Спарк DataFrame основан на состоянии
val Array(df1, df2) = myDataFrame.randomSplit(Array(0.6, 0.4))
Однако мне нужно разделить myDataFrame на основе булева состояния. Имеются ли что-нибудь вроде следующего?
val Array(df1, df2) = myDataFrame.booleanSplit(col("myColumn") > 100)
Я хотел был бы не делать два отдельных .filter звонки.
точно такая же проблема. Трудно поверить, что вам нужно сделать два фильтра, вместо того, чтобы делать одно сканирование. – medloh