2017-01-30 7 views
0

В настоящее время у нас есть реализация в свинге для генерации файлов последовательности из записей, в которых некоторые атрибуты записи обрабатываются как ключ файла последовательности, и все записи, соответствующие этому ключу, сохраняются в одном файле последовательности. Когда мы движемся к искру, я хочу знать, как это можно сделать в искры?Могу ли я создать файл последовательности в Spark?

ответ

0

saveAsSuqunceFile сохраняет данные в виде файла последовательности.

val a=sc.parallelize(List(1,2,3,4,5)).map(x=>(x,x*10)).saveAsSequenceFile("/saw1") 

$ hadoop fs -cat /sqes/part-00000 
SEQ org.apache.hadoop.io.IntWritable org.apache.hadoop.io.IntWritableZ  tTrh7��g�,�� 
2[[email protected] ~]$ 

читать использование sequencefile sc.sequenceFile

val sw=sc.sequenceFile("/saw1/part-00000", classOf[IntWritable],classOf[IntWritable]).collect