У меня есть Azure HDInsight Spark кластер настроен. Я хотел бы отправить работу удаленно в мой кластер:Отправить задание на Azure HDInsight удаленно
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.SparkConf;
public class App
{
public static void main(String[] args)
{
SparkConf conf = new SparkConf().setAppName("App").setMaster("spark://12.34.56.78:7077");
JavaSparkContext sc = new JavaSparkContext(conf);
}
}
Кластер был создан в режиме пряжи. Мастер для работников искры - «пряжа-клиент». Было бы желательно напрямую подключиться к имени хоста или IP-адресу.
Что было бы хорошим путем?
Я хотел бы держаться подальше от таких решений, как Livy. Есть ли другой путь? Как насчет понижения кластера HDInsight от YARN до автономного (чтобы я мог отправлять задания непосредственно в мастер Spark)? –
@TempestDave Я не знаю, почему вы хотите понизить HDInsight от кластера до автономного. И это возможно с помощью ручной переконфигурации для HDInsight как автономного режима, но никакого смысла в Azure нет, потому что HDInsight, созданный вами, работает на многоэкземпляре Azure VM, который не изменяется. Если вы хотите использовать автономный Hadoop/Spark, вы можете установить его вручную на одном экземпляре Azure VM. –