Как проверить пустой РДУ в PySpark
tweetStream.foreachRDD((rdd, time) => {
val count = rdd.count()
if (count > 0) {
var fileName = outputDirectory + "/tweets_" + time.milliseconds.toString
val outputRDD = rdd.repartition(partitionsEachInterval)
outputRDD.saveAsTextFile(fileName)
}
Я пытаюсь проверить значение счетчика или пустой RDD в потоковых данных в питона образом, выносливом поиске путей, а также пытался примеры ссылки ниже. http://spark.apache.org/docs/latest/streaming-programming-guide.html
Пожалуйста, отформатируйте свой ответ, чтобы улучшить качество .. особенно добавьте блоки кода. – nakashu