Я хочу создать ковариационную матрицу из фрейма данных, который еще не подходит для его создания.Как организовать запрос RPostgreSQL и создать матрицу ковариации в R
После использования RPostgreSQL для запроса базы данных У меня есть кадр данных следующего типа:
pg_id item_id value date
1 67808755896 23.5 2016-11-12
2 223337345 0 2016-11-12
3 254337000000 1 2016-11-12
4 34604777037 0 2016-11-12
5 142223438000 14.3 2016-11-12
6 170555690000 22 2016-11-12
Весь кадр данные из ~ 500 000 строк с примерно 16 000 item_id лет. Item_id повторяются (оглядываясь назад через пару месяцев).
В конечном итоге я хочу создать матрицу ковариации для значений item_id.
Для того, чтобы так, в качестве первого шага я хочу переставить кадр данных таким образом, что я в конечном итоге с кадром данных, которые будут выглядеть следующим образом:
item_id
date 67808755896 223337345 254337000000 ...
2016-11-12 value value value
2016-11-12 value value value
2016-11-12 value value value
2016-11-12 value value value
2016-11-12 value value value
2016-11-12 value value value
Моей проблема заключается в том, что я не знаю, как изменить порядок данных так, как мне нужно.
Если есть запрос SQL, который даст мне возможность на момент извлечения, чтобы получить желаемую структуру, я думаю, это было бы лучше.
Внутри R я попробовал пару вещей от использования расплава, а также для распространения, но вычисления, казалось, были тяжелыми для моего локального mac, который в последний раз, когда я пробовал, просто отключился в какой-то момент.
Заранее благодарим за любую помощь!
Благодаря мат! Попробовал это на самом деле, но не думал о fun.aggregate = mean. Хороший, спас мой день! – Elia
'mean' - это просто пример, который суммирует несколько точек данных в одной ячейке сетки, создавая среднее из них. Разумеется, вы также можете использовать 'length' (количество точек данных),' sum' или другие функции ... – lukeA