Извините заранее, если этот вопрос наивен. Я новичок в Python. Я пытаюсь выполнить t-тест на двух столбцах моего фрейма. Имеет смысл только сделать t-тест после группировки столбцов другим столбцом в одном и том же фрейме.Группа по группам в Pandas Series/Dataframe
Я имею дело с чем-то вроде этого:
rand_array = np.random.randint(low=10, high=30, size=9)
rand_array2 = np.random.randint(low=10, high=30, size=9)
d = {'key1':[0,0,1,0,1,1,1,0,1], 'key2': rand_array, 'key3': rand_array2}
df1 = pd.DataFrame(d)
print df1
Выход я получаю:
key1 key2 key3
0 0 20 18
1 0 22 16
2 1 21 26
3 0 21 13
4 1 11 21
5 1 23 10
6 1 17 29
7 0 13 25
8 1 24 29
Затем я группа по ключом1
g1 = df1.groupby('key1')
print g1.groups
>>> {0: Int64Index([0, 1, 3, 7], dtype='int64'), 1: Int64Index([2, 4, 5, 6, 8], dtype='int64')}
Я хочу, чтобы выполнить t-test в основном 0: Int64Index ([0, 1, 3, 7], dtype = 'int64') vs 1: Int64Index ([2, 4, 5, 6, 8], dtype = 'int64').
Возможно ли это?
Спасибо!
Это также реализуется в [ 'scipy.stats.ttest_ind'] (https://docs.scipy.org/doc /scipy-0.14.0/reference/generated/scipy.stats.ttest_ind.html) с 'equal_var = False'. – unutbu
Спасибо вам обоим. Теперь работает :) – tester777