Я довольно новичок в кластерных вычислениях, поэтому не уверен, что это возможно.с использованием sparklyr в RStudio, могу ли я загрузить LOCAL csv-файл в искровой кластер?
Я успешно создаю spark_context
в Rstudio (используя sparklyr) для подключения к нашему локальному Spark-кластеру. Использование copy_to
Я могу загрузить кадры данных из R в Spark, но я пытаюсь загрузить локально сохраненный CSV-файл непосредственно в Spark-кластер, используя spark_read_csv
, не импортируя его сначала в среду R (это большой файл размером 5 ГБ). Он не работает (даже префикс местоположения с файлом: ///), и кажется, что он может загружать только файлы, которые УЖЕ хранятся в кластере.
Как загрузить локальный файл непосредственно в искру, не загружая его сначала в R?
Любые советы, оцененные.
Вы получаете сообщение об ошибке? Что происходит, когда вы говорите, что он «не работает»? – cdeterman
это ошибка 'file not found' – renegademonkey