Я пытаюсь собрать приложение Scala 2.11 Spark 2.0 с использованием hortonworks-spark/shc для доступа к hbase.Scala 2.11 Spark 2.0 hortonworks-spark/shc sbt assembly
Набор зависимостей выглядит просто:
libraryDependencies ++= Seq(
"org.apache.spark" %% "spark-core" % "2.0.2" % "provided",
"com.hortonworks" % "shc-core" % "1.0.1-2.0-s_2.11"
)
Проблема возникает, когда я пытаюсь сборки приложения в баночку жира, потому что есть много зависимостей невозвратности с другой версией, то сборка плагин бросить дубликат ошибки. Один из примеров:
deduplicate: different file contents found in the following:
[error] /home/search/.ivy2/cache/org.mortbay.jetty/jsp-2.1/jars/jsp-2.1-6.1.14.jar:org/apache/jasper/xmlparser/XMLString.class
[error] /home/search/.ivy2/cache/tomcat/jasper-compiler/jars/jasper-compiler-5.5.23.jar:org/apache/jasper/xmlparser/XMLString.class
Кроме того, я не знаю, если это право включать в зависимости баночки, как org.apache.hbase: HBase-сервер: 1.1.2
Таким образом, в основном, вопрос : Кто-нибудь знает правильный способ сборки приложения Scala Spark с использованием этой библиотеки и sbt и может предоставить пример? (А может быть, добавить его в документации hortonworks-spark/shc
Примечание: hortonworks-spark/shc не включают в spark-packages поэтому я не могу использовать --packages вариант, если это не с локальной копией баночки я использую ЭМИ, так. У меня нет предварительно сконфигурированного кластера, где скопируйте банку, не добавляя больше сложностей в развертывание.
Не могли бы вы описать в вопросе, какая проблема возникает, когда вы собираете жировую банку? – ipoteka
@ipoteka Извините. Добавлен один пример ошибки. – angelcervera