Resultados de la búsqueda a petición "data-mining"

2 la respuesta

¿Elegir el algoritmo de clasificación para clasificar la combinación de datos nominales y numéricos?

Tengo un conjunto de datos de aproximadamente 100,000 registros sobre la compra de patrones de clientes. El conjunto de datos contieneEdad (valor continuo de...

2 la respuesta

Cómo agrupar ubicaciones cercanas de latitud y longitud almacenadas en SQL

Estoy tratando de analizar los datos de los accidentes de ciclo en el Reino Unido para encontrar puntos negros estadísticos. Aquí está el ejemplo de los dato...

3 la respuesta

k significa algoritmo de agrupamiento

Quiero realizar un k significa análisis de agrupamiento en un conjunto de 10 puntos de datos, cada uno con una matriz de 4 valores numéricos asociados a ello...

3 la respuesta

¿Cómo seleccionar las 100 funciones principales (un subconjunto) que son más relevantes después de pca?

4 la respuesta

En scikit-learn, ¿DBSCAN puede usar una matriz dispersa?

Obtuve un error de memoria cuando estaba ejecutando el algoritmo dbscan de scikit. Mis datos son aproximadamente 20000 * 10000, es una matriz binaria.(Tal ve...

5 la respuesta

Uso de la memoria DBSCAN de scikit-learn

ACTUALIZADO: Al final, la solución que opté por usar para agrupar mi gran conjunto de datos fue una sugerida por Anony-Mousse a continuación. Es decir, usar ...

2 la respuesta

Reglas de escritura generadas por Apriori.

Estoy trabajando con algunos datos de grandes transacciones. He estado utilizando read.transactions y apriori (partes del paquete arules) para buscar pares f...

3 la respuesta

¿Cómo determinar el número de temas para LDA?

Soy un estudiante de primer año en LDA y quiero usarlo en mi trabajo. Sin embargo, aparecen algunos problemas.Para obtener el mejor rendimiento, quiero estim...

10 la respuesta

¿Puede alguien dar un ejemplo de similitud de coseno de una manera muy simple y gráfica?

Artículo Cosine Similarity en Wikipedia¿Puedes mostrar los vectores aquí (en una lista o algo) y luego hacer los cálculos y ver cómo funciona?Soy un principi...

1 la respuesta

dbscan: límite de configuración en el intervalo de clúster máximo

Según entiendo DBSCAN, es posible que especifique una épsilon de, digamos, 100 metros y, porque DBSCAN tiene en cuentadensidad-accesibilidad yno densidad-alc...