R statystyki ładowania początkowego według grup dla dużych danych
Chcę załadować zestaw danych zawierający grupy. Prostym scenariuszem byłby prosty sposób ładowania początkowego:
data <- as.data.table(list(x1 = runif(200), x2 = runif(200), group = runif(200)>0.5))
stat <- function(x, i) {x[i, c(m1 = mean(x1), m2 = mean(x2)), by = "group"]}
boot(data, stat, R = 10)
To daje mi błądincorrect number of subscripts on matrix
, z powoduby = "group"
część. Udało mi się go rozwiązać za pomocą podzbioru, ale nie podoba mi się to rozwiązanie. Czy istnieje prostszy sposób na wykonywanie tego rodzaju zadań?
W szczególności chciałbym przedstawić dodatkowy argument w funkcji statystykstat(x, i, groupvar)
i przekaż go do funkcji rozruchuboot(data, stat(groupvar = group), R = 100)
?