Resultados de la búsqueda a petición "k-means"

1 la respuesta

Imprimir ClusterID y sus elementos usando Spark KMeans algo.

Tengo este programa que imprime el algoritmo MSSE of Kmeans en apache-spark. Hay 20 grupos generados. Estoy tratando de imprimir el clusterID y los elementos que se asignaron al respectivo clusterID. ¿Cómo hago un bucle sobre el clusterID para ...

1 la respuesta

k-medias con centros iniciales seleccionados

Estoy tratando de k-significa agrupamiento con centroides iniciales seleccionados. Diceaquí [http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html] eso para especificar sus centros iniciales: init : {‘k-means++’, ‘random’ ...

1 la respuesta

OpenCV4: Android Kmean no funciona como se esperaba

Este código debe proporcionar centros de mat con 3 filas y clusterCount número de columnas Mat reshaped_image = imageMat.reshape(1, imageMat.cols()*imageMat.rows()); Mat reshaped_image32f = new Mat(); ...

1 la respuesta

Personalizar la distancia del formulario K-means en Apache Spark Python

Ahora estoy usando K-means para agrupar y seguireste tutorial [http://spark.apache.org/docs/latest/mllib-clustering.html]yAPI [https://spark.apache.org/docs/1.0.0/api/python/pyspark.mllib.clustering-module.html] . Pero quiero usar una fórmula ...

1 la respuesta

Trazar los límites de la zona de clúster en Python con el paquete scikit

Aquí está mi ejemplo simple de tratar con la agrupación de datos en 3 atributos (x, y, valor). cada muestra representa su ubicación (x, y) y su variable de pertenencia. Mi código fue publicado aquí: x = np.arange(100,200,1) y = ...

1 la respuesta

Cómo agregar clústeres pronosticados de k-means en una columna a un marco de datos en Python

Tiene una pregunta sobre la agrupación de kmeans en python. Entonces hice el análisis de esa manera: from sklearn.cluster import KMeans km = KMeans(n_clusters=12, random_state=1) new = data._get_numeric_data().dropna(axis=1) ...

1 la respuesta

Spark :: KMeans llama a takeSample () dos veces?

Tengo muchos datos y he experimentado con particiones de cardinalidad [20k, 200k +]. Yo lo llamo así: from pyspark.mllib.clustering import KMeans, KMeansModel C0 = KMeans.train(first, 8192, initializationMode='random', ...

1 la respuesta

Calcular el costo de Kmeans

Estoy usando estomodelo [https://github.com/yahoo/lopq/blob/master/python/lopq/model.py], que no está escrito por mí. Para predecir los centroides, tuve que hacer esto: model = cPickle.load(open("/tmp/model_centroids_128d_pkl.lopq")) codes ...

1 la respuesta

Factor desequilibrado de KMeans?

Editar: La respuesta de estas preguntas se discute ampliamente en:Suma en chispa ido mal [https://stackoverflow.com/questions/39627773/sum-in-spark-gone-bad] EnCalcular el costo de ...

1 la respuesta

Sklearn Kmeans parámetro confusión?

Entonces puedo corrersklearn kmeans como el seguiente: kmeans = KMeans(n_clusters=3,init='random',n_init=10,max_iter=500)Pero estoy un poco confundido sobre lo que significan los ...