Я добытый список словарей из Стэнфордского НЭКЕ и создал список вроде следующий:Python: Подсчет имен в списке dictiopnaries
myList = [
{'A':{},'B':['C','D'],
'names': {'PERSON': [u'John Butters', u'Bill', u'Hillary Clinton'],'LOCATION': [],
'ORGANIZATION': [u'FactSet', u'Pfizer Inc. PFE']}},
{'A':{'Hello'},'B':['F','E'],
'names': {'PERSON': [u'Tim Anderson', u'Hillary Clinton'], 'LOCATION': [ u'US'],
'ORGANIZATION': [u'Goldman Sachs GS', u'ConocoPhillips COP', u'FactSet']}},
{'A':{'right'},'B':['M','N'],
'names': {'PERSON': [u'Mohammed bin Salman', u'Spano'], 'LOCATION': [u'Saudi Arabia',u'Red Sea'],
'ORGANIZATION': [u'Aramco', u'FactSet', u'Goldman Sachs GS']}}
]
В другом слове у меня есть список, как:
myList = [{},{},{}]
Каждый словарь содержит подробную информацию для одного конкретного документа. Ключ «имен» представляет собой словарь, как:
'names':{'PERSON':[], 'LOCATION':[], 'ORGANIZATION':[]}
Я намерен извлечь частоту значений под ключ «имен» ----> «ОРГАНИЗАЦИЯ» по всему документу, а затем подсчитать, как много раз каждая пара имен происходила вместе в myList. Любая помощь будет принята с благодарностью. Вывод должен выглядеть следующим образом:
{u'FactSet': 3, u'Pfizer Inc. PFE':1, u'Goldman Sachs GS':2, u'ConocoPhillips COP':1, u'Aramco':1}
И, наконец, я хочу, чтобы рассчитывать со-вхождения указанных имен. Выход может быть как:
{[u'FactSet', u'Pfizer Inc. PFE']:1,
[u'Goldman Sachs GS', u'ConocoPhillips COP']:1,
[u'Goldman Sachs GS', u'FactSet'] :2,
[u'Aramco', u'FactSet']:1,
[u'Aramco', u'Goldman Sachs GS']:1 }