Мне нужна помощь. У меня есть следующая таблица:R Количество строк по двум факторам
country_code=c(1,1,1,1,1,1,2,2,2,2,2,2)
target=c('V1','V1','V2','V2','V3','V3','V1','V1','V2','V2','V3','V3')
M1=c('X7','X7','X14','X14','X8','X8','X29','X22','X2','X22','X22','X22')
M2=c('X1','X1','X17','X11','X21','X21','X1','X29','X8','X18','X24','X24')
M3=c('NA','NA','NA','X1','NA','NA','NA','NA','NA','NA','NA','NA')
CountofRun=c(1,2,1,2,1,2,1,2,1,2,1,2)
df<-data.frame(country_code,target,M1,M2,M3,CountofRun)
, и я хотел бы получить таблицу частот для каждого COUNTRY_CODE и целевой комбинации. Так, например, если X7 появляется во всех трех прогонах для country_code = 1 и target = V1, X7 необходимо суммировать до 3. Как вы увидите, меня интересует только подсчет количества раз каждый X1-X30 появляется в этих трех прогонах для каждой из 6 комбинаций country_code и target. Я не могу преобразовать в числовой.
Конечной стол, мы надеемся, будет выглядеть следующим образом
есть причина не использовать 'таблицы (df $ country_code, df $ target) '? – jakub
Привет, Стивен и спасибо, что нашли время. Я попытался data.table и простой aggregate() summary() и даже попытался использовать compare() из другого пакета. Я считаю, что решение может быть связано с dplyr или версией приложения, но я потерян. –
@jakub Этот код не дает выход для меня. Фактически необходимая мне информация удаляется из вывода этого кода. Мне нужно подсчитать, сколько раз каждый из X1-X30 появляется для каждой комбинации country_code и target. –