¿La regresión de cresta con 'glmnet' proporciona coeficientes diferentes a los que calculo por "definición de libro de texto"?

Question

Oct 05, 2016, 01:42 AM

regression machine-learning linear-regression glmnet r

¿La regresión de cresta con 'glmnet' proporciona coeficientes diferentes a los que calculo por "definición de libro de texto"?

Estoy ejecutando la regresión de Ridge con el uso deglmnet R paquete. Noté que los coeficientes que obtengo deglmnet::glmnet Las funciones son diferentes de las que obtengo al calcular los coeficientes por definición (con el uso del mismo valor lambda). ¿Podría alguien explicarme por qué?

Datos (ambos: respuestaY y matriz de diseñoX) están escalados.

library(MASS)
library(glmnet)

# Data dimensions
p.tmp <- 100
n.tmp <- 100

# Data objects
set.seed(1)
X <- scale(mvrnorm(n.tmp, mu = rep(0, p.tmp), Sigma = diag(p.tmp)))
beta <- rep(0, p.tmp)
beta[sample(1:p.tmp, 10, replace = FALSE)] <- 10
Y.true <- X %*% beta
Y <- scale(Y.true + matrix(rnorm(n.tmp))) # Y.true + Gaussian noise

# Run glmnet 
ridge.fit.cv <- cv.glmnet(X, Y, alpha = 0)
ridge.fit.lambda <- ridge.fit.cv$lambda.1se

# Extract coefficient values for lambda.1se (without intercept)
ridge.coef <- (coef(ridge.fit.cv, s = ridge.fit.lambda))[2:(p.tmp+1)]

# Get coefficients "by definition"
ridge.coef.DEF <- solve(t(X) %*% X + ridge.fit.lambda * diag(p.tmp)) %*% t(X) %*% Y

# Plot estimates
plot(ridge.coef, type = "l", ylim = range(c(ridge.coef, ridge.coef.DEF)),
     main = "black: Ridge `glmnet`\nred: Ridge by definition")
lines(ridge.coef.DEF, col = "red")