Stwórz macierz współwystępowania z obserwacji kodowanych sztucznie

Czy istnieje proste podejście do konwersji ramki danych z manekinami na to, czy występuje jakiś aspekt, do macierzy współwystępowania zawierającej liczby dwóch współwystępujących aspektów?

Na przykład. odchodząc od tego

X <- data.frame(rbind(c(1,0,1,0), c(0,1,1,0), c(0,1,1,1), c(0,0,1,0)))
X
 X1 X2 X3 X4
1 1 0 1 0
2 0 1 1 0
3 0 1 1 1
4 0 0 1 0

do tego

  X1 X2 X3 X4
X1 0 0 1 0
X2 0 0 2 1
X3 1 2 0 1
X4 0 1 1 0

questionAnswers(1)

QuestionSolution

To załatwi sprawę:

X <- as.matrix(X)
out <- crossprod(X) # Same as: t(X) %*% X
diag(out) <- 0    # (b/c you don't count co-occurrences of an aspect with itself)
out
#   [,1] [,2] [,3] [,4]
# [1,]  0  0  1  0
# [2,]  0  0  2  1
# [3,]  1  2  0  1
# [4,]  0  1  1  0

Aby uzyskać wyniki w ramce danych dokładnie tak, jak pokazałeś, możesz zrobić coś takiego:

nms <- paste("X", 1:4, sep="")
dimnames(out) <- list(nms, nms)
out <- as.data.frame(out)
 bdemarest16 maj 2012, 19:00
Warto zauważyć, że przekątna jest po prostu sumą kolumn X.
 Josh O'Brien16 maj 2012, 19:15
@bdemarest - Interesujące jest również rozważenie podobieństwa do macierzy wariancji-kowariancji, które różnią się jedynie centrowaniem kolumn przed obliczeniemt(X) %*% X.
 Tyler Rinker16 maj 2012, 19:03
Bardzo dobrze; prosty i łatwy +1

yourAnswerToTheQuestion