У меня есть эта таблица:dplyr не суммируя
> prueba
rutcli elegidosi llamado pago
1 4863 NA 0 0
2 7605 NA 1 1
3 10669 NA 1 1
4 10669 NA 1 1
5 11980 NA 1 1
6 17045 NA 0 1
7 31259 NA 1 1
8 31259 NA 1 1
9 40547 NA 1 1
10 66455 NA 1 1
Мне нужно группе клиента и получить некоторые метрики:
library(dplyr)
by_cli<-group_by(prueba, rutcli,add = TRUE)
summarise(by_cli,
llamado=max(llamado, na.rm=TRUE),
q_EDI=sum(llamado, na.rm=TRUE), reg=length(llamado))
Source: local data frame [8 x 4]
И результат:
rutcli llamado q_EDI reg
1 4863 0 0 1
2 7605 1 1 1
3 10669 1 1 1
4 11980 1 1 1
5 17045 0 0 1
6 31259 1 1 1
7 40547 1 1 1
8 66455 1 1 1
Так , Я не получаю сумму (клиент 10669 и 31259 были дважды).
Я также попытался следующие и получили те же результаты:
prueba %>%
group_by(rutcli) %>%
summarise(llamado=max(llamado, na.rm=TRUE),q_EDI=sum(llamado, na.rm=TRUE),
reg=length(llamado))
Не был ли этот вопрос 'dplyr'? –