Вычисление средних по группам с R
У меня есть данные, с которыми я бы хотел вычислить статистику. Данные организованы таким образом, что у меня есть значение, соответствующее каждому трехэлементному кортежу
(P1,M1,R1,V1)
(P1,M1,R2,V2)
(P1,M2,R1,V1)
...
здесь P1, M1 и R1 не числовые, а V1 и V2. Прямо сейчас у меня есть данные в файле CSV, x2.cvs следующим образом:
P,M,R,V
P1,M1,R1,V1
P1,M1,R2,V2
...
Я читаю данные, используя
d = read.table("x2.csv", sep=",", header=TRUE)
но после этого я не знаю, что делать для обработки данных.
Я хотел бы начать с вычисления простой информации, такой как: каково среднее значение для каждого элемента P (таким образом, среднее будет по всем элементам M и R) или для каждой пары элементов {P, M} (так что среднее здесь будет по элементам R.
Далее я хотел бы сделать немного более сложные вещи, такие как вычисление, сколько элементов P1 больше, чем определенное значение.