У меня есть data.frame с 3 переменными и 1.425.558 наблюдениями. Это реестр установленной электроэнергии от заводов по производству возобновляемых источников энергии. В каждом ряду стоит одна установленная электростанция. В области zipcode могут быть несколько электростанций одного и того же типа.Как суммировать числовую переменную двумя факторами в R
ID zipcode Type power
1 79280 solarpower 3
2 79280 solarpower 3
3 79283 hydroelectric 3
4 79280 biogas 55
5 79280 windpower 2
6 21459 windpower 4
7 21459 windpower 2
Я хотел бы суммировать по zipcode, сколько солнечной энергии/биогаза/ветроэнергетики установлено.
zipcode Type power
21459 windpower 6
79280 solarpower 6
79280 windpower 2
...and so on.
Я уже пытался
aggregate(myDat$power, by=list(myDat$zipcode,myDat$type), FUN=sum)
, но моя память не была sufficant.
Я знаю, что мой dataframe очень большой. Я мог бы сузить его много, потому что мне нужны только данные для этих zipcodes, начинающихся с «2».
Не могли бы вы указать мне на решение? Большое спасибо за помощь начинающему!
Да! !! Это оно! Спасибо! И для вычисления потребовалось всего две секунды! – SEMson