Resultados de la búsqueda a petición "data-mining"
Cómo optimizar K en K - Algoritmo de medias [duplicado]
Posible duplicado: ¿Cómo determino k cuando uso el agrupamiento k-means? [https://stackoverflow.com/questions/1793532/how-do-i-determine-k-when-using-k-means-clustering] ¿Cómo puedo elegir la K inicialmente, si no conozco los datos? ¿Puede ...
Python, minería de datos de registro web para patrones frecuentes
Necesito desarrollar una herramienta para la minería de datos de registro web. Al tener muchas secuencias de URL, solicitadas en una sesión de usuario en particular (recuperada de los registros de aplicaciones web), necesito descubrir los ...
Algoritmo de selección de funciones más simple
Estoy tratando de crear mi propio y sencillo algoritmo de selección de funciones. El conjunto de datos con el que voy a trabajar esaqu [http://www.cs.cornell.edu/people/pabo/movie-review-data/review_polarity.tar.gz] (conjunto de datos muy ...
mlpy - Dynamic Time Warping depende de x?
Estoy tratando de obtener la distancia entre estos dos arreglos que se muestra a continuación por DTW.Estoy usando el Python
Reglas de escritura generadas por Apriori.
Estoy trabajando con algunos datos de grandes transacciones. He estado utilizando read.transactions y apriori (partes del paquete arules) para buscar pares f...
Error al extraer frases usando Gensim
Estoy tratando de obtener los bigrams en las oraciones usando frases en Gensim de la siguiente manera. from gensim.models import Phrases from gensim.models.phrases import Phraser documents = ["the mayor of new york was there", "machine learning ...
Uso de la memoria DBSCAN de scikit-learn
ACTUALIZADO: Al final, la solución que opté por usar para agrupar mi gran conjunto de datos fue una sugerida por Anony-Mousse a continuación. Es decir, usar ...
Implementación del algoritmo de agrupamiento k-means.
En mi programa, estoy tomando k = 2 para el algoritmo k-mean, es decir, quiero solo 2 grupos. Lo he implementado de una manera muy simple y directa, pero tod...
¿Cómo analizar una matriz de adyacencia escasa?
Estoy investigando matrices de adyacencia dispersas donde la mayoría de las celdas son ceros y algunas aquí y allá, cada relación entre dos celdas tiene una descripción polinómica que puede ser muy larga y su análisis lleva mucho tiempo. Mi ...
Operación de minería de datos usando consulta SQL (algoritmo de Apriori difuso): ¿cómo lo codifico usando SQL?
Entonces tengo esta tabla: Trans_ID Name Fuzzy_Value Total_Item 100 I1 0.33333333 3 100 I2 0.33333333 3 100 I5 0.33333333 3 200 I2 0.5 2 200 I5 0.5 2 300 I2 0.5 2 300 I3 0.5 2 400 I1 0.33333333 3 400 I2 0.33333333 3 400 I4 0.33333333 3 500 I1 ...