QR-Zerlegung in lm und biglm unterschiedlich?

Question

Nov 06, 2012, 11:22 AM

QR-Zerlegung in lm und biglm unterschiedlich?

Ich versuche, die R-Matrix aus der in Biglm verwendeten QR-Zerlegung wiederherzustellen. Dafür benutze ich einen Teil des Codes in vcov.biglm und stelle ihn in eine Funktion wie folgt:

qr.R.biglm <- function (object, ...) {
    # Return the qr.R matrix from a biglm object
    object$qr <- .Call("singcheckQR", object$qr)
    p <- length(object$qr$D)
    R <- diag(p)
    R[row(R) > col(R)] <- object$qr$rbar
    R <- t(R)
    R <- sqrt(object$qr$D) * R
    dimnames(R) <- list(object$names, object$names)
    return(R)
}

Insbesondere versuche ich, dasselbe Ergebnis wie mit qr.R aus dem Basispaket zu erhalten, das für QR-Zerlegungen der Klasse "qr" verwendet wird, wie sie in der Klasse lm (lm $ qr) enthalten sind. Der Code für die Basisfunktion lautet wie folgt:

qr.R <- function (qr, complete = FALSE) {
    if (!is.qr(qr)) 
        stop("argument is not a QR decomposition")
    R <- qr$qr
    if (!complete) 
        R <- R[seq.int(min(dim(R))), , drop = FALSE]
    R[row(R) > col(R)] <- 0
    R
}

Es gelingt mir, das gleiche Ergebnis für eine Stichprobenregression zu erzielen, mit Ausnahme der Anzeichen.

x <- as.data.frame(matrix(rnorm(100 * 10), 100, 10))
y <- seq.int(1, 100)
fit.lm <- lm("y ~ .", data =  cbind(y, x))
R.lm <- qr.R(fit.lm$qr)

library(biglm)
fmla <- as.formula(paste("y ~ ", paste(colnames(x), collapse = "+")))
fit.biglm <- biglm(fmla, data = cbind(y, x))
R.biglm <- qr.R.biglm(fit.biglm)

Vergleicht man beide, so ist klar, dass die absoluten Werte übereinstimmen, aber nicht die Vorzeichen.

mean(abs(R.lm) - abs(R.biglm) < 1e-6)
[1] 1
mean(R.lm - R.biglm < 1e-6)
[1] 0.9338843

Ich kann nicht genau herausfinden, warum das so ist. Ich möchte in der Lage sein, das gleiche Ergebnis für die R-Matrix wie ich von biglm zu erhalten.