Вот таблицазапросов, чтобы захватить ТОП X% значений, основанных на агрегации подмножества
parcel| packet|a |b | c
1 | p1 |20|40|50
1 | p2 |20|90|50
1 | p3 |50|40|50
2 | p1 |80|40|50
2 | p2 |20|90|50
3 | p1 |10|80|50
3 | p2 |20|0|50
Каждый пакет имеет пакеты и каждый пакет имеет, Б и здания. Цель состоит в том, чтобы захватить пакеты, которые составляют установленную корпорацию (например, 80%) от общего количества зданий в каждой посылке. Например, общее количество всех зданий в пакете 3 составляет 50 + 20 + 10 + 80 + 50 = 210; 80% 210 - 168. Таким образом, нам нужен пакет 1 (140) + пакет 2 (70) для достижения 80%.
В настоящее время я пытаюсь получить суммы для каждого из пакетов вручную, а затем вычислить пропорции вручную. Я знаю, что есть лучший способ добиться этого в R. Я использовал dplyr, sqldf и другие функции R, но для меня это немного круто. Помогите оценить.
«нам нужно packet1 и packet2 для ее достижения». Однако я начал с ответа и могу редактировать его с помощью обновлений. – theArun
Спасибо. Идея состоит в том, чтобы идентифицировать и разделить пакеты внутри каждой посылки, что даст нам в общей сложности 80%. Вы, конечно, предложили что-то очень полезное. В этом примере я хотел бы проиллюстрировать, что в пакете 3 пакеты 1 и 2 должны достигать 80% от общего значения. Конечная цель состоит в том, чтобы вывести строки, содержащие посылку и соответствующие пакеты, которые составляют до 80% или более. Надеюсь, это прояснится. – HexGuy