Печать ClusterID и его элементов с помощью Spark KMeans algo.
У меня есть эта программа, которая печатает алгоритм MSSE Kmeans на apache-spark. Всего создано 20 кластеров. Я пытаюсь напечатать clusterID и элементы, которые были назначены на соответствующий clusterID. Как мне зациклить на clusterID для печати элементов.
Спасибо вам, ребята!!
val sc = new SparkContext("local", "KMeansExample","/usr/local/spark/", List("target/scala-2.10/kmeans_2.10-1.0.jar"))
// Load and parse the data
val data = sc.textFile("kmeans.csv")
val parsedData = data.map( s => Vectors.dense(s.split(',').map(_.toDouble)))
// Cluster the data into two classes using KMeans
val numIterations = 20
val numClusters = 20
val clusters = KMeans.train(parsedData, numClusters, numIterations)
val clusterCenters = clusters.clusterCenters map (_.toArray)
println("The Cluster Centers are = " + clusterCenters)
// Evaluate clustering by computing Within Set Sum of Squared Errors
val WSSSE = clusters.computeCost(parsedData)
println("Within Set Sum of Squared Errors = " + WSSSE)