sqlContext.read.json("...path.to.file...")
Выполняется ли синтаксический анализ PySpark JSON в Python или JVM?
Я пишу скрипт Spark в Python, используя pyspark. Выполняется ли JSON-анализ в Python или JVM? Если Python, использует ли это расширение C simplejson или является родным Python?
Я делаю лот анализа JSON, так что производительность здесь важна.
Вы также можете установить схему вручную. Во многих случаях вам действительно не нужны все поля, поэтому вы можете установить подмножество полей, построить схему и предоставить эту схему напрямую –
Да, в моем коде я действительно делаю 'sqlContext.read.schema (...) .json (...) '. Я просто упростил пример здесь :) Спасибо! –