Resultados de la búsqueda a petición "data-mining"

2 la respuesta

Cómo optimizar K en K - Algoritmo de medias [duplicado]

Posible duplicado: ¿Cómo determino k cuando uso el agrupamiento k-means? [https://stackoverflow.com/questions/1793532/how-do-i-determine-k-when-using-k-means-clustering] ¿Cómo puedo elegir la K inicialmente, si no conozco los datos? ¿Puede ...

2 la respuesta

Python, minería de datos de registro web para patrones frecuentes

Necesito desarrollar una herramienta para la minería de datos de registro web. Al tener muchas secuencias de URL, solicitadas en una sesión de usuario en particular (recuperada de los registros de aplicaciones web), necesito descubrir los ...

4 la respuesta

Algoritmo de selección de funciones más simple

Estoy tratando de crear mi propio y sencillo algoritmo de selección de funciones. El conjunto de datos con el que voy a trabajar esaqu [http://www.cs.cornell.edu/people/pabo/movie-review-data/review_polarity.tar.gz] (conjunto de datos muy ...

2 la respuesta

mlpy - Dynamic Time Warping depende de x?

Estoy tratando de obtener la distancia entre estos dos arreglos que se muestra a continuación por DTW.Estoy usando el Python

2 la respuesta

Reglas de escritura generadas por Apriori.

Estoy trabajando con algunos datos de grandes transacciones. He estado utilizando read.transactions y apriori (partes del paquete arules) para buscar pares f...

2 la respuesta

Error al extraer frases usando Gensim

Estoy tratando de obtener los bigrams en las oraciones usando frases en Gensim de la siguiente manera. from gensim.models import Phrases from gensim.models.phrases import Phraser documents = ["the mayor of new york was there", "machine learning ...

5 la respuesta

Uso de la memoria DBSCAN de scikit-learn

ACTUALIZADO: Al final, la solución que opté por usar para agrupar mi gran conjunto de datos fue una sugerida por Anony-Mousse a continuación. Es decir, usar ...

4 la respuesta

Implementación del algoritmo de agrupamiento k-means.

En mi programa, estoy tomando k = 2 para el algoritmo k-mean, es decir, quiero solo 2 grupos. Lo he implementado de una manera muy simple y directa, pero tod...

1 la respuesta

¿Cómo analizar una matriz de adyacencia escasa?

Estoy investigando matrices de adyacencia dispersas donde la mayoría de las celdas son ceros y algunas aquí y allá, cada relación entre dos celdas tiene una descripción polinómica que puede ser muy larga y su análisis lleva mucho tiempo. Mi ...

1 la respuesta

Operación de minería de datos usando consulta SQL (algoritmo de Apriori difuso): ¿cómo lo codifico usando SQL?

Entonces tengo esta tabla: Trans_ID Name Fuzzy_Value Total_Item 100 I1 0.33333333 3 100 I2 0.33333333 3 100 I5 0.33333333 3 200 I2 0.5 2 200 I5 0.5 2 300 I2 0.5 2 300 I3 0.5 2 400 I1 0.33333333 3 400 I2 0.33333333 3 400 I4 0.33333333 3 500 I1 ...