Cálculo paralelo de la imputación múltiple usando el paquete R de ratones
Quiero ejecutar 150 imputaciones múltiples usandomice
enR
. Sin embargo, para ahorrar algo de tiempo de computación, mentiría para subdividir el proceso en flujos paralelos (como lo sugiere Stef van Buuren en "Imputación flexible para datos faltantes").
Mi pregunta es: ¿cómo hacer eso?
Me puedo imaginar 2 opciones:
opt.1:
imp1<-mice(data, m=1, pred=quicktry, maxit=15, seed=1)
imp2<-mice(data, m=1, pred=quicktry, maxit=15, seed=1)
imp...<-mice(data, m=1, pred=quicktry, maxit=15, seed=1)
imp150<-mice(data, m=1, pred=quicktry, maxit=15, seed=1)
y luego combinar las imputaciones juntas usandocomplete
yas.mids
después
opt.2:
imp1<-mice(data, m=1, pred=quicktry, maxit=15, seed=VAL_1to150)
imp2<-mice(data, m=1, pred=quicktry, maxit=15, seed=VAL_1to150)
imp...<-mice(data, m=1, pred=quicktry, maxit=15, seed=VAL_1to150)
imp150<-mice(data, m=1, pred=quicktry, maxit=15, seed=VAL_1to150)
añadiendoVAL_1to150
de lo contrario, me parece (puedo estar equivocado) que si todos se ejecutan con el mismo conjunto de datos y la misma semilla, obtendrás 150 veces el mismo resultado.
¿Hay más opciones?
Gracias