Cálculo paralelo de la imputación múltiple usando el paquete R de ratones

Question

Jun 04, 2014, 04:31 PM

r parallel-processing multiple-mice r-mice

Cálculo paralelo de la imputación múltiple usando el paquete R de ratones

Quiero ejecutar 150 imputaciones múltiples usandomice enR. Sin embargo, para ahorrar algo de tiempo de computación, mentiría para subdividir el proceso en flujos paralelos (como lo sugiere Stef van Buuren en "Imputación flexible para datos faltantes").

Mi pregunta es: ¿cómo hacer eso?

Me puedo imaginar 2 opciones:

opt.1:

imp1<-mice(data, m=1, pred=quicktry, maxit=15, seed=1)
imp2<-mice(data, m=1, pred=quicktry, maxit=15, seed=1)
imp...<-mice(data, m=1, pred=quicktry, maxit=15, seed=1)
imp150<-mice(data, m=1, pred=quicktry, maxit=15, seed=1)

y luego combinar las imputaciones juntas usandocomplete yas.mids después

opt.2:

imp1<-mice(data, m=1, pred=quicktry, maxit=15, seed=VAL_1to150)
imp2<-mice(data, m=1, pred=quicktry, maxit=15, seed=VAL_1to150)
imp...<-mice(data, m=1, pred=quicktry, maxit=15, seed=VAL_1to150)
imp150<-mice(data, m=1, pred=quicktry, maxit=15, seed=VAL_1to150)

añadiendoVAL_1to150 de lo contrario, me parece (puedo estar equivocado) que si todos se ejecutan con el mismo conjunto de datos y la misma semilla, obtendrás 150 veces el mismo resultado.

¿Hay más opciones?

Gracias