2016-03-29 3 views
9

Возможно, этот вопрос может показаться немного абстрактным, вот оно:Спарк SQL: Преобразование РДД [GenericData.Record] для DataFrame

val originalAvroSchema : Schema = // read from a file 
val rdd : RDD[GenericData.Record] = // From some streaming source 

// Looking for a handy: 
val df: DataFrame = rdd.toDF(schema) 

Я исследую spark-avro, но он имеет поддержку только для чтения из файла, а не от существующего RDD.

+0

не уверен, почему ответ был удален –

+0

есть запрос тянуть за то, что вы ищете https://github.com/databricks/spark-avro/pull/113/files –

+0

Я удалил ответ, потому что он был опущен. –

ответ

0
import com.databricks.spark.avro._ 

val sqlContext = new SQLContext(sc) 
val rdd : RDD[MyAvroRecord] = ... 
val df = rdd.toAvroDF(sqlContext)