Моя среда - это автономный кластер искры. Мне нужно, чтобы сервер hive thrift разрешил доступ JDBC к паркетному файлу. В то же время мне нужно запустить одно Java-приложение (использующее HiveContext), в то время как бережливый сервер работает, чтобы загрузить некоторые данные в один и тот же файл паркета. Я провел эксперименты как с метасторным автономным, основанным на DERBY (по умолчанию), так и с метасторе, управляемым базой данных mysql. Проблема, которая у меня есть, почти такая же. Если запущенный сервер работает, приложения java получают 0 ядер, поэтому он ожидает закрытия бережливого сервера (а затем приложение java закрывает его обработку корректно), а если приложение запущено, бережливый сервер даже не может запускаться. Фактически, бережливый сервер получает столько ядер и ссылается на столько рабочих потоков, сколько доступно, не позволяя другим приложениям получать ресурсы. Можно ли сократить количество рабочих процессов, выделенных для бережливого сервера? По-видимому, нет никакой конкретной конфигурации для управления этим параметром.искробезопасный сервер использует столько рабочих потоков, сколько доступно
Я не думаю, что это вопрос nr. из ядер, потому что я могу добавить больше ядер, и результат будет идентичным.
Не могли бы вы посоветовать мне по этой теме? Большое спасибо.
Спасибо большое, что он работал. Я также добавил этот параметр в команду, чтобы запустить сервер thirft: -hiveconf spark.cores.max = 1 Полную команду для запуска бережливого сервера выглядит следующим образом: $ SPARK_HOME/sbin/start-thriftserver.sh - Исходная искра: // marco-linux-64: 7077 --hiveconf spark.cores.max = 1 --hiveconf hive.server2.thrift.port = 10000 --hiveconf hive.server2.thrift.bind.host = marco-linux-64 - -hiveconf hive.metastore.warehouse.dir =/home/marco/SparkData --driver-class-path '/home/marco/Repository/jars/mysql-connector-java-5.1.32.jar' –
принять ответ, если разрешили вашу проблему. – Gourav