Я использую искры 1.3.1 и я хочу, чтобы хранить данные в улье как формат ORC ..Сохранение формата орка через Спарк в Java
Ниже линии, показывающие ошибки, это выглядит как орк не supporing как данные источник в искры 1.3.1
dataframe.save("/apps/hive/warehouse/person_orc_table_5", "orc");
java.lang.RuntimeException: Failed to load class for data source: orc
at scala.sys.package$.error(package.scala:27)
at org.apache.spark.sql.sources.ResolvedDataSource$.lookupDataSource(ddl.scala:194)
at org.apache.spark.sql.sources.ResolvedDataSource$.apply(ddl.scala:237)
at org.apache.spark.sql.DataFrame.save(DataFrame.scala:1196)
at org.apache.spark.sql.DataFrame.save(DataFrame.scala:1156)
at SparkOrcHive.main(SparkOrcHive.java:62)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:606)
at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:577)
at org.apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.scala:174)
at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:197)
at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:112)
at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)
Спарк 1.4 есть ..
write.format("orc").partitionBy("age").save("peoplePartitioned")
, чтобы хранить в формате оркского ..
Есть ли способ сохранить файл в формате ORC в искровом 1.3.1 ??
Спасибо,
, когда я использую орг. apache.spark.sql.hive.orc в методе сохранения, искрообразование вызывает исключение, так как не удалось загрузить класс для источника данных. используя scala для искры 1.3.1 –
Как вы подаете искрение? – Ankit
@AdamRight, я отредактировал свой ответ и его просто отлично работает для меня. – Ankit