Если вы используете Spark, то это относительно просто с выпуском Spark 1.4, см. Пример кода ниже, который использует пакет SparkR, который теперь является частью ядра Apache Spark фреймворк.
# install the SparkR package
devtools::install_github('apache/spark', ref='master', subdir='R/pkg')
# load the SparkR package
library('SparkR')
# initialize sparkContext which starts a new Spark session
sc <- sparkR.init(master="local")
# initialize sqlContext
sq <- sparkRSQL.init(sc)
# load parquet file into a Spark data frame and coerce into R data frame
df <- collect(parquetFile(sq, "/path/to/filename"))
# terminate Spark session
sparkR.stop()
Развернутое пример показан @ https://gist.github.com/andyjudson/6aeff07bbe7e65edc665
Я не знаю ни одного другого пакета, который вы могли бы использовать, если вы не использовали искру.
указывают нам на файл образца, показывают нам, где формат файла спецификация, расскажите нам немного больше, чем «как я читать файлы формата Foo в R? " – Spacedman
@Spacedman Извините, забыли, что публика будет более общей. Это самоописывающееся хранилище столбчатых данных, которое теоретически будет отображаться непосредственно в R-кадры данных. – metasim