Я пытаюсь сохранить dataFrame с помощью bucketByискра 2,0 bucketBy сохранить
df.write.bucketBy("column").format("parquet").save()
Но это производит ошибку: исключение в потоке «основного» org.apache.spark.sql.AnalysisException: «Сохранить» делает не поддерживать брэкинг прямо сейчас;
Есть ли другой способ сохранить результат bucketBy?
Нет предложения? – syl
DataFrameWriter.bucketBy доступен для загрузки вывода, например, Hive. Пожалуйста, обратитесь к документу API по адресу https://spark.apache.org/docs/2.0.0/api/java/org/apache/spark/sql/DataFrameWriter.html#bucketBy(int,%20java.lang.String,% 20scala.collection.Seq) – Salim