Вот код, который я использую, чтобы написать dataframe в JSON. Я бег этого кода из дирижабля:Невозможно записать световой информационный фрейм в файл json
val df = Seq((2012, 8, "Batman", 9.8), (2012, 8, "Hero", 8.7), (2012, 7, "Robot", 5.5), (2011, 7, "Git", 2.0)).toDF("year", "month", "title", "rating")
df.write.json("/tmp/out.json")
Что я ожидаю dataframe данных, записанных в /tmp/out.json файла. Однако это создает каталог с именем «/tmp/out.json» и внутри, что я нахожу следующие два файла:
_SUCCESS
._SUCCESS.crc
Ни один из этих файлов не имеющих данных в формате JSON. Что мне здесь не хватает?
Are вы запускаете кластер или только локально? Если в кластере вы проверили выходной каталог своих исполнителей, а не на машине драйвера? – ImDarrenG
@ImDarrenG Я могу видеть json данные об исполнителе. И он разделен на исполнителей. Есть ли способ получить все данные json в одном файле json? –
Да, это возможно, см .: http://stackoverflow.com/a/40594798/7098262 – Mariusz