0

У меня есть Спарк кластер в моих удаленных узлах CentOS и я хочу подключить этот удаленный кластер Спарка из моей локальной окна R студии (я использую Rstudio Desktop в мои местные окна)Как подключить удаленный кластер Спарка из локальной ОС Windows Rstudio

if (nchar(Sys.getenv("SPARK_HOME")) < 1) { 
    Sys.setenv(SPARK_HOME = "/home/remoteclusterpath/spark-1.6.0-bin-hadoop2.6") 
    .libPaths(c(file.path(Sys.getenv("SPARK_HOME"), "R", "lib"), .libPaths())) 
} 
library(SparkR, lib.loc = "/home/remoteclusterpath/spark-1.6.0-bin-hadoop2.6/R/lib") 

sc <- sparkR.init(master = "spark://<IP-Address>:7077", sparkEnvir = list(spark.driver.memory="2g")) 

Я получаю эту ошибку ниже

Error in library(SparkR) : there is no package called ‘SparkR’ 

пожалуйста кто-нибудь предоставить мне й е решение заранее спасибо

ответ

0

Чтобы использовать SparkR в RStudio вы можете установить sparklyr кладя эту команду на RStudio консоли:

intall.packages("sparklyr") 

Позже, вы можете загрузить этот пакет с помощью следующей команды:

library("sparklyr") 
1

Чтобы использовать SparkR в RStudio, вам нужно установить пакет SparkR и загрузить его. Используйте эти команды

install.packages("SparkR") 

library(SparkR)