2017-02-01 13 views
0

У меня есть Azure HDInsight Spark кластер настроен. Я хотел бы отправить работу удаленно в мой кластер:Отправить задание на Azure HDInsight удаленно

import org.apache.spark.api.java.JavaSparkContext; 
import org.apache.spark.api.java.JavaRDD; 
import org.apache.spark.SparkConf; 

public class App 
{ 
    public static void main(String[] args) 
    { 
     SparkConf conf = new SparkConf().setAppName("App").setMaster("spark://12.34.56.78:7077"); 
     JavaSparkContext sc = new JavaSparkContext(conf); 
    } 
} 

Кластер был создан в режиме пряжи. Мастер для работников искры - «пряжа-клиент». Было бы желательно напрямую подключиться к имени хоста или IP-адресу.

Что было бы хорошим путем?

ответ

0

Вы можете отправить работу удаленно с помощью службы Livy. Пожалуйста Reffer к этой документации о том, как сделать это: https://docs.microsoft.com/en-us/azure/hdinsight/hdinsight-apache-spark-livy-rest-interface

+0

Я хотел бы держаться подальше от таких решений, как Livy. Есть ли другой путь? Как насчет понижения кластера HDInsight от YARN до автономного (чтобы я мог отправлять задания непосредственно в мастер Spark)? –

+0

@TempestDave Я не знаю, почему вы хотите понизить HDInsight от кластера до автономного. И это возможно с помощью ручной переконфигурации для HDInsight как автономного режима, но никакого смысла в Azure нет, потому что HDInsight, созданный вами, работает на многоэкземпляре Azure VM, который не изменяется. Если вы хотите использовать автономный Hadoop/Spark, вы можете установить его вручную на одном экземпляре Azure VM. –