Я только начал использовать Друид, в частности, с RDruid, и поскольку наш набор данных довольно велик, я хотел бы извлечь меньший рандомизированный образец из БД.Случайная выборка из баз данных друида
Использование RDruid У меня есть запрос, который выглядит следующим образом:
res2 = druid.query.groupBy(
url = druid.url("hostname", port=8080),
dataSource = "playback",
intervals = interval(
fromISO("2013-09-20T00:00:00"),
now()
),
dimensions = list(dimension("platformInfo_deviceType"), dimension("isp")),
granularity="hour",
aggregations = list(
sum(metric("streamStartCount"))
)
)
Я хотел бы, чтобы он строить почасовой/поминутно накопительные на случайной части исходных данных.
Возможно ли это? Возможно, я мог бы попробовать что-то вроде назначения случайного 4-значного числа/строки в базовые записи данных и применить фильтр, который только сворачивает записи с соответствующими правилами.
E.g. если случайная строка> 8888, то она будет выбирать все записи между 8889 и 9999.
Любые идеи?
Если вы покажете мне, как вытащить n-ю запись, я покажу вам, как пробовать любое количество записей в (псевдо) -случайных интервалах. –