У меня есть задача анализа данных, в которой я хочу проанализировать журналы обслуживания в реальном времени. Не могли бы вы помочь мне, как это сделать в Пандах?Создание регулярных временных рядов из нерегулярных временных рядов в pandas
Мой первоначальный dataframe выглядеть следующим образом:
Я хочу, чтобы генерировать временные ряды для каждого имени службы и сделать корреляционный анализ, основанный на этом.
Как я могу разделить этот файл данных на разные данные (индексированные по временному интервалу) для каждого имени службы путем агрегирования их соответствующих данных, как показано ниже?
Пс: Я видел похожие вопросы, но я считаю, что мой вопрос отличается от того, что я хочу генерировать много временных рядов из фреймворка данных. И извините заранее, если это легкий один, я новичок в панд :)
Вот мой Dataframe как код:
ERRORCODE ERRORTEXT SERVICENAME REQTDURATION RESPTDURATION HOSTDURATION
10:00:27:000 NaN NaN serviceA 0 1 4612
10:00:27:822 NaN NaN serviceB 0 1 14994
10:01:27:622 -1 'Timeout' serviceA 1 0 7695
10:01:27:323 NaN NaN serviceD 0 1 2612
10:01:27:755 NaN NaN serviceA 0 1 1612
10:02:27:666 -5 'Timeout' serviceA 0 1 11612
10:02:27:111 NaN NaN serviceB 0 1 111112
10:02:27:333 NaN NaN serviceC 0 1 412
, когда я запускаю это я получил следующее исключение, я упускаю что-то? ValueError: слишком много значений для распаковки – cacert
, исходящих из этой строки? – Stefan
в начале петли. df - это мой объект фрейма данных? он говорит, что не может перебирать фрейм данных, как я предполагаю? – cacert