1
У меня есть таблица в панд ФРГруппировка нескольких столбцов и сумма подсчета в панд ФР
master_id pidx pidy flag count
xxx a b A 10
xxx a c A 20
xxx a d A 30
xxx b d A 40
xxx a c C 50
xxx a c C 60
xxx x y C 70
xxx x y C 80
я хочу сделать группировку по нескольким столбцам и суммируя количество, независимо от флага.
т.е.
xxx a c A 20
xxx a c C 50
xxx a c C 60
конечный результат должен быть
xxx a c A 130
финальный стол должен быть
master_id pidx pidy flag count
xxx a b A 10
xxx a c A 130
xxx a d A 30
xxx b d A 40
xxx x y C 150
ваш код работает, но говорят, что у меня есть еще один столбец говорят master_id, то я могу» t добавьте этот столбец в 'df.groupby (['master_id', 'pidx', 'pidy'])' См., что я редактировал свой df с другим столбцом. – Shubham
Я помещаю leafID внутри функции agg и, похоже, работает: 'df = df.groupby (['pidx', 'pidy']). Agg ({'leafId': 'first', 'flag': 'first', ' 'count': 'sum'}). reset_index() ', но это правильный путь? – Shubham
Это зависит от того, что вам нужно. Если нужна группа по столбцам pydx и pidy и получить первую строку столбца leafId и флаг и суммировать все строки в столбце count, вы правы. – jezrael