sparkr

    1зной

    2ответ

    Я довольно новичок в кластерных вычислениях, поэтому не уверен, что это возможно. Я успешно создаю spark_context в Rstudio (используя sparklyr) для подключения к нашему локальному Spark-кластеру. Испо

    1зной

    1ответ

    В моем текущем проекте я использую библиотеку обучения H2O в SparkR. У меня есть несколько CSV-файлов и чтение этих CSV-файлов через h2o-фрейм данных. Теперь я хотел бы применить функцию h2o.merge() п

    0зной

    2ответ

    У меня есть 3 кластера узлов, имеющих Cloudera 5.9, работающих на CentOS 6.7. Мне нужно подключить пакеты R (работающие на моем ноутбуке) к запуску Spark в режиме кластера на Hadoop. Однако, если я по

    2зной

    1ответ

    В реализации Java/Scala/Python Spark можно просто вызвать метод foreachRDD или DataFrame, чтобы распараллелить итерации по набору данных. В SparkR Я не могу найти такую ​​инструкцию. Каким будет прави