2017-02-09 12 views
0

Рассмотрим исходные события (альфа-набор в Друида языке) вида timestamp | compoundId | dimension 1 | dimension 2 | metric 1 | metric 2можно загрузить последнюю доступную дату-точку и отбросить остальную часть в друиде?

Обычно в друидских данные могут быть загружены в реальном времени узлов и исторических узлов на основе некоторых правил. Эти правила, по-видимому, связаны с диапазонами времени. Например .:

  • нагрузки последнего день данных о коробочном
  • нагрузка на прошлой неделе (за исключением последнего дня) на коробках B
  • держать остальное в глубоком хранении, но не загружать сегменты.

В отличии я хочу, чтобы поддержать потребительский случай:

  • нагрузки последнего события для каждого данного compoundId на коробки A. Независимо от того, что последнее событие случилось быть загружено сегодня или вчера.

Возможно ли это?

В качестве альтернативы, если выше не представляется возможным, я полагал, что это, возможно, возможно, как обходной путь для создания betaset (лучшего уровня грануляционного следующим образом):

Учитывая ALPHASET со схемой, как определенно выше, создать betaset, чтобы:

  • все события для данного compoundId свернуты.
  • metric1 и metric2 установлены в метрику из последнего события (наибольшей отметки времени).

Любой совет, который очень ценится.

ответ

0

Я считаю, что first and last aggregators - это то, что вы ищете.

+0

Любые документы об этом уже? Кажется, это поддерживает вторую просьбу, которую я описал нет? –

+0

неважно. Найдено документы/обоснование [здесь] (https://github.com/druid-io/druid/issues/2845). Спасибо –

+1

@ Geert-Jan вот документ [ссылка] (https://github.com/druid-io/druid/blob/master/docs/content/querying/aggregations.md) –