2016-07-08 7 views
1

У меня есть огромный файл .json, как показано ниже. Я хочу преобразовать этот JSON в dataframe на Spark.Преобразование файла json в одну строку

{ 
    "movie": { 
     "id": 1, 
     "name": "test" 
    } 
} 

Когда я выполнить следующий код, я получаю _corrupt_record ошибку:

val df = sqlContext.read.json("example.json") 
df.first() 

В последнее время я узнал, что Спарк поддерживает только одну строку JSON файлов, как:

{ "movie": { "id": 1, "name": "test test" } } 

Как я могу преобразовать текст JSON из нескольких строк в одну строку.

+0

заменить череды строк пустой строкой –

ответ