Примените t-критерий ко многим столбцам в фрейме данных, разбитому на фактор
У меня есть датафрейм с одним столбцом фактора с двумя уровнями и многими числовыми столбцами. Я хочу разделить фрейм данных по столбцу коэффициентов и провести t-тест по парам столбцов.
Используя пример набора данных Пуромицин, я хочу, чтобы результат выглядел примерно так:
Variable Treated Untreated p-value Test-statistic CI of difference****
Conc 0.3450 0.2763 XXX T XX - XX
Rate 141.58 110.7272 xxx T XX - XX
Я думаю, что я ищу решение, использующее PLYR, которое может вывести вышеупомянутые результаты в хороший фрейм данных.
(Puromycin содержит только две числовые переменные, но решение, которое я ищу, будет работать на кадре данных со многими числовыми переменными)
ОБНОВЛЕНИЕ - я постараюсь уточнить, что я имею в виду.
Я хотел бы перейти от данных, которые выглядят так:
Grouping variable var1 var2 var3 var4 var5
1 3 5 7 3 7
1 3 7 5 9 6
1 5 2 6 7 6
1 9 5 7 0 8
1 2 4 5 7 8
1 2 3 1 6 4
2 4 2 7 6 5
2 0 8 3 7 5
2 1 2 3 5 9
2 1 5 3 8 0
2 2 6 9 0 7
2 3 6 7 8 8
2 10 6 3 8 0
Для результирующего кадра данных, который выглядит следующим образом:
"Mean in group 1" "Mean in group 2" "P-value of difference" "N"
var1 ## ## ## ##
var2 ## ## ## ##
var3 ## ## ## ##
var4 ## ## ## ##
var5 ## ## ## ##
Может быть, это что-то с mapply, которое я ищу, потому что я хочу разделить мой dataframe на dataframe1 и dataframe2 по двухуровневому коэффициенту и применить функцию (t-test) к первым частям dataframe1 и dataframe2, а затем t-тест для вторых частей dataframe1 и dataframe2, а затем t-тест для третьих частей dataframe1 и dataframe2 и т. д. для всех пар столбцов, сгенерированных с помощью деления на множитель.