Run SparkR | или R на моем Cloudera 5.9 Spark - Отличная библиотека

У меня есть 3 кластера узлов, имеющих Cloudera 5.9, работающих на CentOS 6.7. Мне нужно подключить пакеты R (работающие на моем ноутбуке) к запуску Spark в режиме кластера на Hadoop.Run SparkR | или R на моем Cloudera 5.9 Spark

Однако, если я попытаюсь подключить локальный R через Sparklyr Connect к Hadoop Spark, он дает ошибку. Поскольку он ищет дом Искры на самом ноутбуке.

Я googled и нашел, что мы можем установить SparkR и использовать R с Spark. Однако у меня мало вопросов относительно того же.

Я скачал файл деготь из https://amplab-extras.github.io/SparkR-pkg/ Но мой вопрос я непосредственно скопировать его на мой сервер Linux и установить?
Должен ли я останавливать/удалять существующую Искра, которая НЕ стоит одна и с использованием Yarn i.e работает в режиме кластеров? или SparkR может просто запустить поверх него, если я устанавливаю его на сервер?
Или мне нужно запустить Spark on Stand Alone (получить Spark gateways и запустить мастер/ведомый с помощью скрипта) и установить пакет из командной строки linux поверх него?
Если он будет установлен, я смогу получить к нему доступ через CM UI?

Помогите, я новичок в этом и действительно нуждаюсь в руководстве.

Спасибо, Shilpa

источник

2017-01-03 TextShilpa

Как вы пытаетесь подключиться к свече кластера? Этот ответ может быть полезен: http://stackoverflow.com/a/38107699/2026277 –