Т-тест в Пандах
Если я хочу вычислить среднее значение для двух категорий в Пандах, я могу сделать это следующим образом:
data = {'Category': ['cat2','cat1','cat2','cat1','cat2','cat1','cat2','cat1','cat1','cat1','cat2'],
'values': [1,2,3,1,2,3,1,2,3,5,1]}
my_data = DataFrame(data)
my_data.groupby('Category').mean()
Category: values:
cat1 2.666667
cat2 1.600000
У меня есть много данных, отформатированных таким образом, и теперь мне нужно сделать T-стест, чтобы увидеть, если среднееcat1 а такжеcat2 статистически разные. Как я могу это сделать?