У меня есть большой набор данных вокруг 3 столбцов и 600000 строк. После поворота он преобразует в 1000 столбцов и 600 строк.
Подмножество входных данныхПовернуть таблицу в SQL vs свернуть один и тот же фрейм данных в R
Date Id Price
2014/12/03 Id1 100
2014/12/03 Id2 120
2014/12/03 Id3 110
2014/12/03 Id4 105
2014/12/02 Id1 150
2014/12/02 Id2 115
2014/12/02 Id3 140
2014/12/02 Id4 135
2014/12/01 Id1 165
2014/12/01 Id2 155
2014/12/01 Id3 185
2014/12/01 Id4 195
2014/11/30 Id1 160
2014/11/30 Id2 170
2014/11/30 Id3 180
2014/11/30 Id4 190
Выходные данные после того, как поворотное
Date Id1 Id2 Id3 Id4
2014/12/03 100 120 110 105
2014/12/02 150 115 140 135
2014/12/01 165 155 185 195
2014/11/30 160 170 180 190
В наборе данных будет большим, которое будет более эффективным производительность?
1. Сводные в SQL и вернуться к R
2. Возврат исходный набор данных для R и выполнения пивот в R
Я использую RODBC для извлечения данных с сервера MSSQL. Любое предложение по этому поводу?
Почему вы не сравниваете операции самостоятельно? –
Вы можете улучшить производительность в DataTable, установив столбец для индексирования с помощью Sort with DataView, который улучшит производительность при восстановлении данных. –
Я только что воспроизвел полный набор данных (600000 строк и 3 столбца) и 'dcast (df, Date ~ Id) 'привел к четверти секунды –