R statystyki ładowania początkowego według grup dla dużych danych

Question

Sep 20, 2013, 11:14 AM

data-manipulation data.table statistics-bootstrap r

R statystyki ładowania początkowego według grup dla dużych danych

Chcę załadować zestaw danych zawierający grupy. Prostym scenariuszem byłby prosty sposób ładowania początkowego:

data <- as.data.table(list(x1 = runif(200), x2 = runif(200), group = runif(200)>0.5))
stat <- function(x, i) {x[i, c(m1 = mean(x1), m2 = mean(x2)), by = "group"]}
boot(data, stat, R = 10)

To daje mi błądincorrect number of subscripts on matrix, z powoduby = "group" część. Udało mi się go rozwiązać za pomocą podzbioru, ale nie podoba mi się to rozwiązanie. Czy istnieje prostszy sposób na wykonywanie tego rodzaju zadań?

W szczególności chciałbym przedstawić dodatkowy argument w funkcji statystykstat(x, i, groupvar) i przekaż go do funkcji rozruchuboot(data, stat(groupvar = group), R = 100)?