Разделить dataframe по сумме числа игр в стране и команды, полученные с использованием groupby
и реорганизован с помощью transform
.
df = pd.DataFrame({'country': ["NL"] * 9,
'team': ["A"] * 3 + ["B"] * 3 + ["C"] * 3,
'outcome': ["WIN", "LOSE", "DRAW"] * 3,
'week1': [2, 3, 4, 4, 5, 2, 4, 4, 2],
'week2': [3, 2, 5, 2, 3, 4, 2, 3, 4],
'week3': [4, 5, 2, 3, 2, 5, 3, 2, 5]})
df.set_index(['country', 'team', 'outcome'], inplace=True)
>>> df.divide(df.reset_index().groupby(['country', 'team']).transform(sum).values)
week1 week2 week3
country team outcome
NL A WIN 0.222222 0.300000 0.363636
LOSE 0.333333 0.200000 0.454545
DRAW 0.444444 0.500000 0.181818
B WIN 0.363636 0.222222 0.300000
LOSE 0.454545 0.333333 0.200000
DRAW 0.181818 0.444444 0.500000
C WIN 0.400000 0.222222 0.300000
LOSE 0.400000 0.333333 0.200000
DRAW 0.200000 0.444444 0.500000
Чтобы сделать это более понятным, вы можете увидеть, что делает transform
. Он возвращает результаты в той же форме, что и исходный фрейм данных.
>>> df.reset_index().groupby(['country', 'team']).transform(sum).values
array([[ 9, 10, 11],
[ 9, 10, 11],
[ 9, 10, 11],
[11, 9, 10],
[11, 9, 10],
[11, 9, 10],
[10, 9, 10],
[10, 9, 10],
[10, 9, 10]])
Вы также можете использовать transform
в методе, предложенном @firelynx и пропустить его последний шаг:
>>> df.divide(df.groupby(level=[0,1]).transform(sum))
week1 week2 week3
country team outcome
NL A WIN 0.222222 0.300000 0.363636
LOSE 0.333333 0.200000 0.454545
DRAW 0.444444 0.500000 0.181818
B WIN 0.363636 0.222222 0.300000
LOSE 0.454545 0.333333 0.200000
DRAW 0.181818 0.444444 0.500000
C WIN 0.400000 0.222222 0.300000
LOSE 0.400000 0.333333 0.200000
DRAW 0.200000 0.444444 0.500000