Zusammenführen von Endpunkten eines Bereichs mit einer Sequenz
In einer meiner Anwendungen gibt es einen Code, der Informationen von a abruftdata.table
Objekt abhängig von Werten in einem anderen.
# say this table contains customers details
dt <- data.table(id=LETTERS[1:4],
start=seq(as.Date("2010-01-01"), as.Date("2010-04-01"), "month"),
end=seq(as.Date("2010-01-01"), as.Date("2010-04-01"), "month") + c(6,8,10,5),
key="id")
# this one has some historical details
dt1 <- data.table(id=rep(LETTERS[1:4], each=120),
date=seq(as.Date("2010-01-01"), as.Date("2010-04-30"), "day"),
var=rnorm(120),
key="id,date")
# and here I finally retrieve my historical information based one customer detail
#
library(data.table)
myfunc <- function(x) {
# some code
period <- seq(x$start, x$end, "day")
dt1[.(x$id, period)][, mean(var)]
# some code
}
um das Ergebnis für alles zu bekommen, was ich benutzeadply
library(plyr)
library(microbenchmark)
> adply(dt, 1, myfunc)
id start end V1
1: A 2010-01-01 2010-01-07 0.3143536
2: B 2010-02-01 2010-02-09 -0.5796084
3: C 2010-03-01 2010-03-11 0.1171404
4: D 2010-04-01 2010-04-06 0.2384237
> microbenchmark(adply(dt, 1, myfunc))
Unit: milliseconds
expr min lq median uq max neval
adply(dt, 1, myfunc) 8.812486 8.998338 9.105776 9.223637 88.14057 100
Kennen Sie einen Weg, um dieadply
Rufen Sie an und erledigen Sie die oben genannten Aufgaben in einemdata.table
Aussage? Oder doch eine schnellere Methode? (Titelbearbeitungsvorschlag mehr als willkommen, ich könnte mir keinen besseren vorstellen, danke)