Teste T em pandas
Se eu quiser calcular a média de duas categorias no Pandas, posso fazer assim:
data = {'Category': ['cat2','cat1','cat2','cat1','cat2','cat1','cat2','cat1','cat1','cat1','cat2'],
'values': [1,2,3,1,2,3,1,2,3,5,1]}
my_data = DataFrame(data)
my_data.groupby('Category').mean()
Category: values:
cat1 2.666667
cat2 1.600000
Eu tenho muitos dados formatados dessa maneira, e agora eu preciso fazer umT-teste para ver se a média decat1 ecat2 são estatisticamente diferentes. Como eu posso fazer isso?