Я хочу обработать файлы Apache Parquet (в моем случае, созданные в Spark) на языке программирования R. Доступен ли считыватель R? Или выполняется работа над одним? Если нет, то какой был бы наиболее ц
Я пытаюсь использовать SparkR пакет в R. У меня есть все зависимые пакеты, как devtools, Rtools.exe и т.д. Когда я пытаюсь следующую команду: install_github("amplab-extras/SparkR-pkg",subdir="pkg")
С помощью SparkR я пытаюсь создать PoC для создания RDD, который я создал из текстовых файлов, который содержит около 4M строк. Ядро Spark работает в облаке Google, используется bdutil и состоит из 1