Resultados de la búsqueda a petición "data-mining"

1 la respuesta

Cómo clasificar claramente para cada fila en pandas.

Lo que tengouna matriz de similitud usuario-usuario en la que algunas filas tienen valores duplicados yNaN userId 316 320 359 370 910 userId 316 1.0 0.500000 0.500000 0.500000 NaN 320 0.5 1.000000 0.242837 0.019035 0.031737 359 0.5 0.242837 ...

2 la respuesta

Error al extraer frases usando Gensim

Estoy tratando de obtener los bigrams en las oraciones usando frases en Gensim de la siguiente manera. from gensim.models import Phrases from gensim.models.phrases import Phraser documents = ["the mayor of new york was there", "machine learning ...

1 la respuesta

¿Por qué dos vectores no es similitud pero el resultado es 1?

Estoy usando la fórmula de similitud de coseno para calcular la similitud entre dos vectores. Probé dos vectores diferentes como este: Vector1 (-1237373741, 27, 1, 1, 331289590, 1818540802) Vector2 (-1237373741, 49, 1, 1, 331289590, ...

2 la respuesta

Trace el miembro del clúster en r

Uso el paquete DTW en R. y finalmente terminé la agrupación jerárquica. pero quiero trazar un grupo de series de tiempo por separado como en la imagen de abajo. sc <- read.table("D:/handling data/confirm.csv", header=T, sep="," ) rownames(sc) ...

6 la respuesta

PCA ¿Para características categóricas?

Según tengo entendido, pensé que PCA solo se puede realizar para funciones continuas. Pero al tratar de entender la diferencia entre la codificación onehot y la codificación de etiquetas llegó a través de una publicación en el ...

4 la respuesta

Error en do_one (nmeth): NA / NaN / Inf en llamada a función extranjera (arg 1)

Tengo una tabla de datos ("norma") que contiene valores numéricos, al menos por lo que puedo ver, normalizados de la siguiente forma: Cuando estoy ejecutando k <- kmeans(norm,center=3)Estoy recibiendo el siguiente error: Error in ...

1 la respuesta

¿Cómo se usaría la Estimación de densidad de kernel como método de agrupamiento 1D en scikit learn?

Necesito agrupar un conjunto de datos univariado simple en un número predeterminado de clústeres. Técnicamente, estaría más cerca de agrupar u ordenar los datos, ya que solo es 1D, pero mi jefe lo llama agrupación, por lo que me voy a quedar con ...

1 la respuesta

¿Cómo analizar una matriz de adyacencia escasa?

Estoy investigando matrices de adyacencia dispersas donde la mayoría de las celdas son ceros y algunas aquí y allá, cada relación entre dos celdas tiene una descripción polinómica que puede ser muy larga y su análisis lleva mucho tiempo. Mi ...

3 la respuesta

Función GBM R: obtenga importancia variable por separado para cada clase

Estoy usando elgbm [http://www.inside-r.org/packages/cran/gbm/docs/gbm]funciona en R (paquete gbm) para adaptarse a modelos estocásticos de aumento de gradiente para clasificación multiclase. Simplemente estoy tratando de obtener la importancia ...

1 la respuesta

R: comportamiento poco claro de la función tuneRF (paquete randomForest)

Me siento incómodo con el significado destepFactor parámetro de latuneRF [http://www.inside-r.org/packages/cran/randomForest/docs/tuneRF]función que se utiliza para ajustar elmtry parámetro utilizado más en ...