Sobre o GForce no data.table 1.9.2
Não sei como tirar grande proveito do GForce no data.table 1.9.2
Nova otimização: GForce. Em vez de agrupar os dados, os locais dos grupos são passados para versões agrupadas de soma e média (gsum e gmean) que, em seguida, calculam o resultado para todos os grupos em uma única passagem seqüencial pela coluna para eficiência do cache. Além disso, como a função g * é chamada apenas uma vez, não precisamos encontrar maneiras de acelerar a chamada soma ou média repetidamente para cada grupo. `
ao enviar o seguinte código
DT <- data.table(A=c(NA,NA,1:3), B=c("a",NA,letters[1:3]))
DT[,sum(A,na.rm=TRUE),by= B]
Eu tenho esse
B V1 1: a 1 2: NA 0 3: b 2 4: c 3
e ao tentarDT[,sum(A,na.rm=FALSE),by= B]
, Eu tenho
B V1 1: a NA 2: NA NA 3: b 2 4: c 3
Esses resultados explicam o que o GForce faz, Adicionando ona.rm = TRUE/FALSE
opção?
Muito obrigado!