Kolorowanie wykresu ggplot za pomocą klastrów k-średnich?
Próbuję utworzyć wykres par 6 zmiennych danych za pomocą ggplot2 i pokolorować punkty zgodnie z k-średnich, do których należą. Przeczytałem dokumentację imponującego pakietu „GGally” oraz nieformalną poprawkę autorstwa Adama Laiacano [http://adamlaiacano.tumblr.com/post/13501402316/colored-plotmatrix-in-ggplot2]. Niestety, nie udało mi się znaleźć żadnego sposobu na uzyskanie żądanego wyjścia.
Oto przykładowy kod: -
#The Swiss fertility dataset has been used here
data_ <- read.csv("/home/tejaskale/Ubuntu\ One/IUCAA/Datasets/swiss.csv", header=TRUE)
data_ <- na.omit(data_)
u <- c(2, 3, 4, 5, 6, 7)
x <- data_[,u]
k <- 3
maxIterations <- 100
noOfStarts <- 100
filename <- 'swiss.csv'
library(ggplot2)
library(gridExtra)
library(GGally)
kmeansOutput <- kmeans(x, k, maxIterations, noOfStarts)
xNew <- cbind(x[,1:6], as.factor(kmeansOutput$cluster))
names(xNew)[7] <- 'cluster'
kmeansPlot <- ggpairs(xNew[,1:6], color=xNew$cluster)
OR
kmeansPlot <- plotmatrix(xNew[,1:6], mapping=aes(colour=xNew$cluster))
Obie działki są tworzone, ale nie są kolorowe według klastrów.
Mam nadzieję, że nie przegapiłem odpowiedzi na to pytanie na forum i przepraszam, jeśli rzeczywiście tak jest. Każda pomoc byłaby wysoko ceniona.
Dzięki!