Учитывая DataFrame df
, можно получить размер групп по колонку А сПолучения как размер группы и мин в столбце B группировки по колонку А
df.groupby(['columnA']).size()
и значением mimimun в столбце В пределах каждой группы с
df.groupby(['columnA']).agg({'columnB':min})
или (синтаксический сахар, я предполагаю)
df.groupby(['columnA'])['columnB'].min()
, но как я могу ОСТ ain непосредственно DataFrame с такими двумя столбцами?
В SQL, если вы знакомы с ним, это было бы так просто, как
SELECT count(columnA), min(columnB) FROM table GROUP BY columnA
Спасибо заранее за любую подсказку.
Я думаю, что ваш первый ответ 'df.groupby (['columnA']). Agg ({'columnA': 'size', 'columnB': 'min'})' был более общим и полезным в реальном мире. Я бы предложил добавить его обратно. – mmj
@mmj Конечно, я могу добавить рекламное сообщение об использовании dicts. – miradulo
Возможно, вам будет интересно решить следующий вопрос: http://stackoverflow.com/q/42399574/694360 – mmj