2015-01-06 2 views
1

Я работаю над заданием, где я должен вычислить плотность события. Предположим, что определенное событие происходит 5 раз в течение нескольких секунд, это будет означать, что оно будет иметь более высокую плотность, чем если бы оно произошло 5 раз в течение нескольких часов.Плотность событий времени

У меня есть во владении, время, в которое происходит событие.

Я сначала думал о вычислении прошедшего времени между каждыми двумя последовательными событиями, а затем играл со средним и средним значениями этих значений.

Моя проблема в том, что я не знаю, как точно представлять это понятие плотности через математику. Предположим, что у меня 5 событий, которые происходят очень близко друг к другу, а затем длинный перерыв, а затем снова 5 событий, которые действительно близки друг к другу. Я хотел бы иметь возможность представлять это как высокую плотность. Как мне это сделать?

В последнем примере я понимаю, что мое значение не будет действительно репрезентативным, но мое стандартное отклонение покажет это. Однако как я могу получить значение одной плотности (скажем, между 0 и 1), с которой я мог бы оценивать разные события?

Благодарим за помощь!

+1

Этот вопрос не соответствует теме, потому что речь идет не о программировании. –

+0

Я голосую, чтобы закрыть этот вопрос как не по теме, потому что речь идет о математике, а не программировании. – Pang

ответ

0

Для плотности, чтобы понять, что вам нужно определить 2 вещи:

  • диапазон, где вы смотрите на него,
  • и единица времени

После того, что вы можете сказать Например, с 12:00 до 12:10 плотность события составляла в среднем 10/мин.

Что имеет смысл в вашем случае, очевидно, зависит от ваших входных данных. Если ваше измерение длится 1 час, и у вас есть миллионы записей, то, вероятно, секунды или миллисекунды - лучший выбор для устройства. Если вы измеряете в течение недели и имеете несколько записей, тогда день является лучшим подразделением.

1

Я бы попробовал harmonic mean, который представляет собой скорость, с которой происходят ваши события, все еще давая вам усредненное значение времени. Она определяется по формуле:

harmonic mean definition

Я думаю, что его поведение близко к тому, что вы ожидаете, как он измеряет то, что вы хотите, но не между 0 и 1 и с обратными тенденциями (малые значения означают плотные, большие значения означают разреженный). Давайте рассмотрим несколько ваших примеров:

  1. ~ 5 событий в час. Предположим, что для простоты между каждым событием есть 10 минут. Затем у нас есть H = 6 /(6 * 1/10) = 10
  2. ~ 5 событий за 10 минут, затем ничего до конца часа (50 минут). Предположим, все короткие интервалы 2,5 минуты, а затем H = 6/(5/2.5 + 1/50) = 6 * 50/101 = 2.97
  3. ~ 5 событий за 10 минут, но этот цикл перезагружается каждые полчаса, таким образом, мы имеем 20 минут, как последний интервал вместо 50. Тогда мы получим H = 6/(5/2.5 + 1/20) = 6 * 20/41 = 2.92

Как вы можете видеть, эффект более длинных и более редких значений в наборе уменьшается из-за того, что мы используем инверсии, тем самым уменьшая вес к поведению «между пакетами».Также вы можете сравнивать поведение с той же «плотностью всплеска», но это не происходит на той же частоте, и вы получите числа, близкие, но порядок которых все еще отражает эту разницу.

+0

Большое спасибо за этот ответ. Кажется, это то, что я искал! –