Resultados de la búsqueda a petición "k-means"

1 la respuesta

Factor desequilibrado de KMeans?

Editar: La respuesta de estas preguntas se discute ampliamente en:Suma en chispa ido mal [https://stackoverflow.com/questions/39627773/sum-in-spark-gone-bad] EnCalcular el costo de ...

2 la respuesta

¿Es Spark's KMeans incapaz de manejar bigdata?

KMeans tiene varios parámetros para suformación [http://spark.apache.org/docs/latest/api/python/pyspark.mllib.html?highlight=kmeans#pyspark.mllib.clustering.KMeans.train] , con el modo de inicialización predeterminado en kmeans ||. El problema es ...

1 la respuesta

Sklearn Kmeans parámetro confusión?

Entonces puedo corrersklearn kmeans como el seguiente: kmeans = KMeans(n_clusters=3,init='random',n_init=10,max_iter=500)Pero estoy un poco confundido sobre lo que significan los ...

1 la respuesta

¿Scikit-learn utilizará GPU?

Implementación de lectura de scikit-learn en tensroflow: http://learningtensorflow.com/lesson6/ ...

1 la respuesta

Revelar características del clúster k-modes

Estoy realizando un análisis de clúster en datos categóricos, por lo tanto, uso el enfoque de modos k. Mis datos tienen la forma de una encuesta de preferencias: ¿Qué le parece el cabello y los ojos? [/imgs/6T7QR.png] El encuestado puede ...

3 la respuesta

Error al inicializar SparkContext: se debe establecer una URL maestra en su configuración

solíaeste codigo [https://github.com/prashantprakash/KDDDataResearch/blob/master/Code/approach1Plus2/src/main/scala/PCA.scala] Mi error es: Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties 17/02/03 20:39:24 INFO ...

0 la respuesta

Cómo mostrar el número total en la misma coordenada en la programación R

(pregunta de actualización 11/09/2017) Estos son mis códigos para agrupar kmodes en R: library(klaR) setwd("D:/kmodes") data.to.cluster <- read.csv('kmodes.csv', header = TRUE, sep = ';') cluster.results <- kmodes(data.to.cluster[,2:5], ...

1 la respuesta

¿Cómo asignar una nueva observación a los clústeres de Kmeans existentes basados en la lógica de centrípodos de clúster más cercana en Python?

Utilicé el siguiente código para crear clústeres de k-means utilizando Scikit learn. kmean = KMeans(n_clusters=nclusters,n_jobs=-1,random_state=2376,max_iter=1000,n_init=1000,algorithm='full',init='k-means++') kmean_fit = ...

1 la respuesta

Pyspark - ValueError: no se pudo convertir la cadena en flotante / literal no válido para float ()

Estoy tratando de usar datos de un marco de datos de chispa como entrada para mi modelo k-means. Sin embargo, sigo recibiendo errores. (Ver sección después del código) Mi marco de datos de chispa y se ve así (y tiene alrededor de 1 millón ...

1 la respuesta

¿Cómo puedo evitar problemas de NAN?

Me estoy poniendoMean of empty slice advertencias de tiempo de ejecución. Cuando imprimo cuáles son mis variables (matrices numpy), varias de ellas contienennan valores. La advertencia de tiempo de ejecución está mirando la línea 58 como ...