Это должно быть очевидно, но я не мог найти легкое решение.Pandas dataframe для подсчета матрицы
У меня есть панд DataFrame вроде этого:
actual | predicted
------ + ---------
Apple | Apple
Apple | Apple
Apple | Banana
Banana | Orange
Orange | Apple
Я хочу это:
| Apple | Banana | Orange
------ + ------- + ------- + -------
Apple | 2 | 1 | 0
Banana | 0 | 0 | 1
Orange | 1 | 0 | 0
Принято на 'crosstab'. Unstacking size() кажется немного взломанным для меня. –
Благодарим вас за прием! Первое решение быстрее, но я согласен, что это немного взломать. – jezrael
'В [142]:% timeit pd.crosstab (df.actual, df.predicted) 100 петель, лучше всего 3: 5,04 мс за цикл' и ' В [143]:% timeit df.groupby ([ «фактический», «предсказанный»]). size(). unstack (fill_value = 0) 1000 циклов, лучше всего 3: 1,28 мс за цикл' – jezrael