2013-12-07 4 views
2

Проблема, которую мы пытаемся решить: Храните все данные, которые могут быть запрошены позже, чтобы вывести производительность веб-службы. Дайте визуальное представление данных.TSDB vs HBase: что выбрать в долгосрочной перспективе?

Вот мое понимание до сих пор от того, что я прочитал на Hbase и на сайтах TSDB

  • TSDB хранит данные в Hbase, хотя и в небольшом количестве нестандартным способом (широкий ряд форматов)

  • TSDB невероятно быстрый и дает способы добавления графиков очень быстро.

  • HBase, хотя и медленный по сравнению с TSDB, дает вам возможность использовать драйвер SIMBA ODBC для подключения к Tableau, что является удивительно гибким и красивым визуальным представлением данных.

Еще одна проблема с TSDB он не работает с текущем HBase .96 (Я знаю, что Тсуна @ работает на нем, но я не имею график для стабильного выпуска tsdb, который работает против текущего Hbase.96)

Таким образом, ваш простой ответ может быть Hbase или TSDB, или в дополнение к выбору одного над другим вы можете обосновать свой ответ и помочь мне выбрать один над другим.

Я открыт для других решений, если они могут поддерживать около триллиона точек данных, хранящихся в течение года.

ответ

1

По моему честному мнению, Если вам нужны данные для построения графика, вы должны рассмотреть возможность использования OpenTSDB. Я не уверен в долгосрочном периоде, что может быть лучше, потому что OpenTSDB постоянно развивается, а в ноябре была выпущена версия RC 2.0. Существует также вилка OpenTSDB, которая называется KairosDB, и она использует в качестве базы данных Apache Cassandra, так что вы можете хранить точки до миллисекунд, в то время как OpenTSDB позволяет хранить точки до нескольких секунд.

Поэтому я предлагаю вам распределенные базы данных Timeseries, такие как OpenTSDB/KairosDB, для прокладки данных довольно простым способом. Не уверен в долгосрочном вопросе, возможно, что-то лучше можно было бы разработать над Hbase в следующем месяце из-за его природы с открытым исходным кодом.

1

Если вы настроены на экосистему Hadoop, Axibase Time-Series Database - это еще один продукт, который работает поверх HBase. У нас нет встроенной интеграции с Tableau, но драйвер JDBC должен появиться в Q4 2015, и это позволит вам получать данные временных рядов (сырые и агрегированные) с SQL-подобными запросами, которые мы поддерживаем.

Обновление 2016-05-26: Драйвер JDBC ATSD Type 4 выпущен в апреле 2016 года под лицензией Apache 2. Исходный код и примеры, доступные по адресу https://github.com/axibase/atsd-jdbc

+0

После нескольких лет наблюдения за экосистемой адуопа с другими вариантами мы пошли с вещами-не-haddop из-за Hadoop над головой. Это была большая проблема для разработчиков DevOp. –