У меня есть данные в базе данных, и я хочу работать с ним в Spark, используя sparklyr.Передача данных из базы данных в Spark с использованием sparklyr
я могу использовать DBI -На пакет, чтобы импортировать данные из базы данных в R
dbconn <- dbConnect(<some connection args>)
data_in_r <- dbReadTable(dbconn, "a table")
затем скопировать данные из R Спарк с использованием
sconn <- spark_connect(<some connection args>)
data_ptr <- copy_to(sconn, data_in_r)
Копирование дважды медленно для больших наборов данных.
Как я могу скопировать данные непосредственно из базы данных в Spark?
sparklyr имеет несколько параметров для импорта, но ничего не найдено. sdf_import()
выглядит как возможность, но неясно, как использовать его в этом контексте.