Мы являемся операционным хранилищем данных. У нас есть таблица контроля за партиями, которая содержит следующую информацию:Механизм предупреждения для хранилища данных
- Имя файла, обработанного на складе.
- Дата и время начат процесс партии.
- Число обработанных строк и затраченное время.
Мы думаем о построении механизма предупреждения, который будет в основном поднять тревогу в любом из следующих аномальных ситуаций (на основе анализа прошлых данных):
- Файл не поступали.
- Файл занял более среднего времени для обработки.
- Файл имеет очень низкий или очень высокий ряд строк строки.
Какой был бы наилучший способ решить эту проблему. Является ли это кандидатом на машинное обучение?
Спасибо за ответ. У меня есть один вопрос. Если какая-то конкретная партия имела исключительно высокий ряд строк, включите их в свой средний расчет? Существует ли правило вокруг этого? –
@ Гилберт, если количество строк или время обработки не соответствуют нормальному распределению, SD может быть неверным ... –
@ Ананд Каннан: Я бы сказал, нет, но вы знаете свои данные лучше, чем я. –