Я бы хотел сбросить первые n RDD из DStream. Я попытался использовать следующую функцию вместе с преобразованием, но она не работает (ERROR OneForOneStrategy: org.apache.spark.SparkContext java.io.NotSerializableException), и я не думаю, что это выполнило бы мою настоящую цель - удалить RDD, потому что он будет возвращать пустые.Как удалить RDD из DStream в Spark Streaming?
var num = 0
def dropNrdds(myRDD: RDD[(String, Int)], dropNum: Int) : RDD[(String, Int)] = {
if (num < dropNum) {
num = num + 1
return myRDD
}
else {
return sc.makeRDD(Seq())
}
}
Есть ли способ отрезать первые n окон, но все равно получить остальную часть потока? Я посмотрел на эту функцию, и я думаю, что мне нужно указать конец фрагмента. Моя мотивация: http://stackoverflow.com/questions/26445407/how-can-i-perform-an-operation-on-two-windowed-dstreams-with-an-offset – Zatricion
Или есть способ, которым я могу поддерживать отслеживать фрагмент, который я сделал, и продолжать перемещать его, когда все добавляется к входному потоку? – Zatricion