Como acelerar a estimativa de GLM?
Estou usando o RStudio 0.97.320 (R 2.15.3) no Amazon EC2. Meu quadro de dados tem 200k linhas e 12 colunas.
Eu estou tentando ajustar uma regressão logística com aproximadamente 1500 parâmetros.
R está usando 7% de CPU e tem 60 + GB de memória e ainda está demorando muito tempo.
Aqui está o código:
glm.1.2 <- glm(formula = Y ~ factor(X1) * log(X2) * (X3 + X4 * (X5 + I(X5^2)) * (X8 + I(X8^2)) + ((X6 + I(X6^2)) * factor(X7))),
family = binomial(logit), data = df[1:150000,])
Alguma sugestão para acelerar isto por uma quantia significante?