Из фрейма данных с временными строками (результаты strptime), каков наилучший способ агрегирования статистики для интервалов?Что такое эффективный метод разделения и агрегации интервалов из временных строк в кадре данных?
интервалы может быть час, день и т.д.
Там же функция aggregate
, но это не помогает с назначением каждой строки на интервал. Я планирую добавить столбец в фрейм данных, который обозначает интервал, и использовать его с aggregate
, но если есть лучшее решение, было бы здорово его услышать.
Спасибо за любые указатели!
Пример данные
Пяти строки с временными метками разделены на 15-минутные интервалы, начиная с 03:00.
Интервал 1
- "2010-01-13 3:02:38 UTC"
- "2010-01-13 3:08:14 UTC"
- «2010-01 -13 3:14:52 UTC»
Интервал 2
- "2010-01-13 3:20:42 UTC"
- "2010-01-13 3:22:19 UTC"
Заключение
Использование решение временного ряда, такое как xts
; однако я не имел успеха, используя их, и набрал cut
. Поскольку в настоящее время мне нужно всего лишь построить гистограммы, а строки сгруппированы по интервалу, этого было достаточно.
cut
используется так понравилось:
interv <- function(x, start, period, num.intervals) {
return(cut(x, as.POSIXlt(start)+0:num.intervals*period))
}
Вы можете использовать значение по умолчанию для 'num.intervals' как' потолок ((max (x) -start)/period) '. Тогда вы уверены, что наибольшая временная метка будет в некоторый интервал. – Marek