У меня есть dataframe с колоннами, как это:Список самых распространенных в группе Pandas?
id lead_sponsor lead_sponsor_class
02837692 Janssen Research & Development, LLC Industry
02837679 Aarhus University Hospital Other
02837666 Universidad Autonoma de Ciudad Juarez Other
02837653 Universidad Autonoma de Madrid Other
02837640 Beirut Eye Specialist Hospital Other
Я хочу найти наиболее распространенные спонсор свинца. Я могу перечислить размер каждой группы с помощью:
df.groupby(['lead_sponsor', 'lead_sponsor_class']).size()
, который дает мне это:
lead_sponsor lead_sponsor_class
307 Hospital of PLA Other 1
3E Therapeutics Corporation Industry 1
3M Industry 4
4SC AG Industry 8
5 Santé Other 1
Но как я могу найти 10 самых распространенных групп? Если я:
df.groupby(['lead_sponsor', 'lead_sponsor_class']).size().sort_values(ascending=False).head(10)
Тогда я получаю сообщение об ошибке:
AttributeError: 'Series' object has no attribute 'sort_values'
Для меня также работает ваше решение. – jezrael