0

Я ищу инструмент визуализации данных, который является открытым исходным кодом, и использует apache Spark в качестве задней части. Я провел некоторое исследование и смог сузить до Apache Zeppelin, где я могу создавать диаграммы/графики и т. Д. На основе таблиц, созданных в Spark SQL, но вот моя проблема: будут нетехнические пользователи, просматривающие визуальные данные, и я не думаю, что они будут знать, как писать SQL и т. Д. Поэтому я хотел бы узнать, знает ли кто-нибудь лучший способ/инструмент . Что-то, что позволило бы им перетащить и вообще не кодировать, минимальная кривая обучения. Пожалуйста, совет.приложение для визуализации данных на основе веб-интерфейса с искривлением заднего конца?

Благодаря Прадипом

+0

У вас есть SQL-инструмент, который вы уже использовали? Если да, то вы можете запустить Spark JDBC Server и подключиться к нему через свой инструмент –

ответ

0

Это может не совсем ответ, чтобы соответствовать вашим потребностям.

Есть некоторые коммерческие инструменты для поддержки перетаскивания.

  • Tableau
  • Tibco Spotfire
  • SAS Визуальные Аналитики

Дела в том, что удобные и перетащить инструмент падения очень дорогостоящие.

Если у нас есть хорошо спроектированный ноутбук Zeppelin инженером по данным с такими функциями.

  • Загрузка данных искры

  • Некоторые пункт для изучения данных с Dynamic Form

  • Публикация результата

Тогда, возможно, большое количество прецеденту уже может быть решена ,

На основе кода изменения намного проще писать код. Предположим, у нас есть следующий код для анализа и построения графика с spark-highcharts в ноутбуке zeppelin.

import org.apache.spark.sql.functions._ 
import com.knockdata.spark.highcharts._ 
import com.knockdata.spark.highcharts.model._ 

highcharts(bank 
    .series("x" -> "age", "y" -> avg(col("balance"))) 
    .orderBy(col("age"))).plot() 

Тогда мы можем иметь краткое руководство, как

Есть столбцы marital, job, education ... может быть использован для замены age

Есть функции sum, min, max ... на замену avg