3

В настоящее время я работаю с системой, которая принимает решения о планировании на основе последовательности запросов и состояния системы.Приведенные измерения из серии событий в качестве входных данных, как мне создать бесконечную серию ввода с тем же профилем?

Я хотел бы взять поток реальных входов, издеваться над некоторыми компонентами и запустить симуляции против остальных. Идея состоит в том, чтобы использовать ее для планирования в отношении пропускной способности системы (т. Е. Когда масштабировать определенные компоненты), отслеживать определенные режимы отказа и анализировать эффекты изменений в кодовой базе (например, моделирование с версией A по сравнению с имитациями версии B) ,

Я могу сделать все, что связано с этим, за исключением создания подходящего входного потока. Повторное воспроизведение точного ввода с производства не очень полезно, потому что трудно получить достаточно длинный поток данных, чтобы выкрикивать некоторые из тех действий, которые я пытаюсь найти. Другими словами, если производство падает на 300 дней ввода, у меня недостаточно данных, чтобы узнать, пока он не упадет. Было рассмотрено повторение одного и того же набора входных данных; но после нескольких первоначальных попыток разработчики все согласны с тем, что симуляция кажется «более случайной».

Об этой конкретной системы:

  • Входной представляет собой серию неравномерно разнесенных событий (то есть стохастический процесс с дискретным временем и непрерывным множеством состояний).
  • Недвижимость не independent друг от друга.
  • Даже более независимые от свойств являются композитами других свойств, которые всегда будут по своей природе невидимыми для меня (приводят к multi-modal distribution).
  • Интервал запроса не зависит от других свойств (то есть много запросов на небольшое количество ресурсов поступает в пакетном режиме, больших запросов нет).
  • В нем есть петли обратной связи.
  • Это доказуемо хаотично.

Итак:

Учитывая поток входных событий с определенным распределением различных свойств (включая интервал), как я генерировать бесконечный поток событий с одинаковым распределением по целому ряду не -независимые свойства?

Осмотревшись, я думаю, что мне нужно сделать Марков-Цепочное моделирование Монте-Карло. Моя проблема заключается в том, как построить Марков-цепочку из существующих входных данных.

ответ

1

Возможно, модель можно моделировать с помощью Copula. Существуют инструменты, которые помогут вам сделать это, например. см. this paper. Помимо этого, я бы предложил переместить вопрос в http://stats.stackexchange.com, так как это статистическая проблема и, вероятно, привлечет к ней больше внимания.