Справочная информация: Я делаю анализ данных записи подробной информации о вызовах (CDR) для сегментации клиента в зависимости от продолжительности их вызова, времени разговора (праздничный звонок или невозвратный звонок, Бизнес-вызов или не бизнес-вызов), возрастная группа абонента и пол. Данные взяты из двух таблиц: cdr (include card_number, service_key, calling, called, start_time, clear_time, duration column)
и subscriber_detail (include subscriber_name, subscriber_address, DOB, gender column)
У меня есть OLAP OLAP, как показано ниже.Проблема проектирования куба OLAP для данных электросвязи
Call_date включает Дату вызова с годом, месяцем и днем. Call_time - время разговора во втором.
Вопрос: - если мы возьмем call_time в второй, то он имеет 86400 колонки на каждый день (может быть проклятием размерности), и поэтому мы считаем, что для уменьшения его габаритного, принимая 30 секунды импульса времени (телекоммуникация заряжает деньги на основной импульс и 30 - длительность импульса для нашего контекста). Первый вопрос: - Это лучший способ заменить время на длительность импульса? И второй: - если один абонент совершает более двух вызовов по диапазону импульсов, это может вызвать проблему, то есть начало первого вызова в 21:01:00 и завершение в 21:01:05, и он начинает второй вызов в 21:01 : 15 и заканчивается в 21:01:20. Как решить эту проблему.
спасибо за ответ ... Я решил с помощью 5-минутного временного интервала ... – nKandel