2015-07-10 3 views
0

У нас есть требование, когда мы должны поддерживать отдельные счета каждый час месяца, для различных комбинаций (пользователь, отвечающий критериям). Мы думаем об использовании HyperLogLog для этого, одним из других требований является предоставление подсчетов объединения и пересечения для условий соответствия (критериев).DataStructure для пересечения Counts

Мы должны выполнять эти операции в течение дня/недели/месяца. Насколько я читал, союзы поддерживаются через hyperloglog. Для пересечений более 2 гиперлогов, по-видимому, имеют высокую частоту ошибок. Есть ли какая-либо другая структура данных, которую мы могли бы использовать для пересечений, удовлетворяющих только низким требованиям к пространству с высокой мощностью или чем-то, что поддерживает пересечение и объединение для подсчета больших отдельных событий?

Любые указатели были бы полезны. Благодаря!!

ответ

0

Ознакомьтесь с дополнением HyperLogLog с помощью MinHash.

+0

Спасибо @Jerry, выглядит многообещающим, будет более подробно смотреть на это. – anishek

 Смежные вопросы

  • Нет связанных вопросов^_^