2017-02-20 32 views
0

Мой вопрос заключается в том, чтобы сэкономить данные от аналитики потока до хранилища blob. В нашей системе мы собираем данные clictstream из многих веб-сайтов через концентраторы событий. Затем мы делаем небольшую группировку и агрегацию. После этого мы отправляем результаты в нашу память.Пользовательские шаблоны для анализа потоков данных для хранения потоков

Проблема заключается в том, что мы хотим отделить наши результаты от многих контейнеров-контейнеров по id для каждого веб-сайта. Теперь мы можем сделать это только по дате и времени, например/logs/{date}/{time}, но мы хотим/{websiteID}/{date}/{time}

Есть ли способ достижения этого?

ответ

0

Проблема заключается в том, что мы хотим отделить наши результаты от многих контейнеров-контейнеров по идентификатору для каждого веб-сайта. Теперь мы можем сделать это только по дате и времени шаблона, как/журналы/{дата}/{время}, но мы хотим, чтобы/{websiteID}/{дата}/{время}

В этом официальном документе stream-analytics-define-outputs упоминается о Path Prefix Pattern из памяти памяти:

Путь к файлу, используемый для записи ваших блоков в указанном контейнере. В пути, вы можете использовать один или более экземпляров следующих 2-х переменных, чтобы указать частоту, что сгустки написаны: {дата}, {время}

Пример 1: cluster1/журналы/{дата}/{время}

Пример 2: cluster1/журналы/{дата}

Основываясь на моем понимании, вы можете создать несколько целей вывода блоб из одного потока Analytics работы для каждого из сайтов и в вашем SQL-подобном запросе la nguage, вы можете фильтровать данные событий и отправлять данные на конкретный вывод. Для получения дополнительной информации вы можете обратиться к Common query patterns.

+0

Как я могу сделать это динамически? Я не хочу делать это для каждого из них: select * в Output1 из Input, где id = 1, выберите * в Output2 из Input, где id = 2 –

+0

Как я знал, вы не могли бы сделать это динамически через Azure Stream Analytics. Создание нескольких целей вывода блоха или нескольких заданий для каждого из ваших сайтов - это более простой способ достижения вашей цели. Или вы могли бы следовать рекомендациям Пита М, но в этот момент вам нужно сделать много работы самостоятельно. –

1

Это дубликат вопрос:

Stream Analytics: Dynamic output path based on message payload

Azure Stream Analytics -> how much control over path prefix do I really have?

Короткая версия выше, вы не можете сделать это в потоке Analytics. Если у вас слишком много целевых путей для нескольких приемников, которые могут быть осуществимы, наилучшим вариантом является поток в один снимок хранилища blob и обработка результатов с помощью чего-то другого, кроме ASA. Функции Azure, WebJobs или ADF - это несколько возможных решений.