R начальная статистика по группам для больших данных
Я хочу загрузить набор данных, в котором есть группы. Простым сценарием будет начальная загрузка простых средств:
data <- as.data.table(list(x1 = runif(200), x2 = runif(200), group = runif(200)>0.5))
stat <- function(x, i) {x[i, c(m1 = mean(x1), m2 = mean(x2)), by = "group"]}
boot(data, stat, R = 10)
Это дает мне ошибкуincorrect number of subscripts on matrix
, потому чтоby = "group"
часть. Мне удалось решить это с помощью поднабора, но мне не понравилось это решение. Есть ли более простой способ заставить эту задачу работать?
В частности, я хотел бы ввести дополнительный аргумент в статистическую функцию, такую какstat(x, i, groupvar)
и передать его в функцию загрузки, какboot(data, stat(groupvar = group), R = 100)
?