Acerca de GForce en data.table 1.9.2
No sé cómo aprovechar GForce en data.table 1.9.2
Nueva optimización: GForce. En lugar de agrupar los datos, las ubicaciones de grupo se pasan a versiones agrupadas de suma y media (gsum y gmean) que luego calculan el resultado para todos los grupos en un solo paso secuencial a través de la columna para la eficiencia de la memoria caché. Además, dado que la función g * se llama solo una vez, no necesitamos encontrar formas de acelerar la suma de llamadas o el significado repetitivo para cada grupo. ``
al enviar el siguiente código
DT <- data.table(A=c(NA,NA,1:3), B=c("a",NA,letters[1:3]))
DT[,sum(A,na.rm=TRUE),by= B]
tengo esto
B V1 1: a 1 2: NA 0 3: b 2 4: c 3
y al intentarDT[,sum(A,na.rm=FALSE),by= B]
, Tengo
B V1 1: a NA 2: NA NA 3: b 2 4: c 3
¿Los resultados explican lo que hace la GForce?na.rm = TRUE/FALSE
¿opción?
¡Muchas gracias!