Я пытаюсь очистить некоторые данные о тике. Мои данные в большой форме. Когда я конвертирую его в широкий, он показывает Error: Duplicate identifiers for rows
. В столбце Time есть временные метки в течение нескольких дней. В столбце SYM есть символы запаса для многих акций. Это моя выборка данные:Как принимать медианные значения столбцов только для временных меток NON DISTINCT
dput(jojo)
structure(list(Time = structure(c(1459481850, 1459481850, 1459482302,
1459482305, 1459482305, 1459482307, 1459482307, 1459482309, 1459482312,
1459482312, 1459482314, 1459482314, 1459482316, 1459482316, 1459482317,
1459482317, 1459482318, 1459482319, 1459482319, 1459482320), class = c("POSIXct",
"POSIXt"), tzone = "Asia/Calcutta"), PRICE = c(1371.25, 1371.25,
1373.95, 1373, 1373, 1373.95, 1373.95, 1373.9, 1374, 1374, 1374.15,
1374.15, 1374, 1374, 1373.85, 1373.85, 1372.55, 1374.05, 1374.05,
1374.15), SIZE = c(39, 58, 5, 4, 7, 20, 5, 10, 21, 179, 10, 100,
98, 78, 14, 11, 30, 10, 11, 39), SYM = c("A", "A", "A", "A",
"A", "A", "A", "A", "A", "A", "B", "B", "B", "B", "B", "B", "B",
"B", "B", "B")), .Names = c("Time", "PRICE", "SIZE", "SYM"), row.names = c(NA,
20L), class = "data.frame")
мне нужно сначала найти те же штампы времени затем взять медиану цены и размера этих меток времени, и заменить эту же отметки времени строки с одной строкой, содержащей средние значениями цены и РАЗМЕР в наборе данных. Но мой код суммирует весь столбец, а не те же строки временного штампа для символа запаса. Это моя попытка:
#Cleaning duplicate time stamps
tt<- jojo %>%group_by(SYM)%>% summarise(Time = ifelse(n() >= 2, median, mean))
#Making wide form
tt<-spread(tt, SYM, PRICE)
Я получаю эту ошибку:
Error in eval(substitute(expr), envir, enclos) : Not a vector
Просьба предложить корректировки. Было бы неплохо, если бы я мог сделать чистку без использования пакета высокой частоты.
Что ожидаемый результат примера вы предоставили? «Ошибка: не вектор» - это потому, что вы не определяете переменную для «медианного» и «среднего» – Sotos
. Я хочу отображать медианную ЦЕНУ и РАЗМЕР для дублирования штампов времени для каждого запаса. – runjumpfly
sp 'jojo%>% group_by (время, SYM)%>% mutate (PRICE = медиана (PRICE), SIZE = медиана (SIZE))%>% filter (duplicated (Time))'? – Sotos