Wie kann die GLM-Schätzung beschleunigt werden?
Ich verwende RStudio 0.97.320 (R 2.15.3) auf Amazon EC2. Mein Datenrahmen hat 200.000 Zeilen und 12 Spalten.
Ich versuche, eine logistische Regression mit ungefähr 1500 Parametern anzupassen.
R verwendet 7% CPU und hat 60 + GB Speicher und dauert noch sehr lange.
Hier ist der Code:
glm.1.2 <- glm(formula = Y ~ factor(X1) * log(X2) * (X3 + X4 * (X5 + I(X5^2)) * (X8 + I(X8^2)) + ((X6 + I(X6^2)) * factor(X7))),
family = binomial(logit), data = df[1:150000,])
Irgendwelche Vorschläge, um dies erheblich zu beschleunigen?