Я очень новичок в R и sqldf и не могу решить основную проблему. У меня есть файл с транзакциями, где каждая строка представляет собой купленный продукт.Выберите максимальную сумму, потраченную в одном порядке
файл выглядит следующим образом:
customer_id,order_number,order_date, amount, product_name
1, 202, 21/04/2015, 58, "xlfd"
1, 275, 16//08/2015, 74, "ghb"
1, 275, 16//08/2015, 36, "fjk"
2, 987, 12/03/2015, 27, "xlgm"
3, 376, 16/05/2015, 98, "fgt"
3, 368, 30/07/2015, 46, "ade"
Мне нужно найти максимальное количество, проведенное в одной транзакции (то же order_number
) каждой customer_id
. Например, в случае customer_id "1"
это будет (74+36)=110
.
Это возвращает общую сумму, потраченную на одного пользователя в покупку, в то время как требуемая мощность кажется только максимальное количество в одной покупке из всех покупок для пользователя. Возможно, возьмите этот вывод и извлеките 'customer_id, max (сумма (сумма))' с 'group by customer_id'? – Aramis7d
@ Элена Берроне, пожалуйста, примите ответ, см. [Что делать, если кто-то отвечает на мой вопрос?] (Http://stackoverflow.com/help/someone-answers) –