En scikit-learn, ¿DBSCAN puede usar una matriz dispersa?

Obtuve un error de memoria cuando estaba ejecutando el algoritmo dbscan de scikit. Mis datos son aproximadamente 20000 * 10000, es una matriz binaria.

(Tal vez no sea adecuado usar DBSCAN con una matriz de este tipo. Soy un principiante del aprendizaje automático. Solo quiero encontrar un método de clúster que no necesite un número de clúster inicial)

De todos modos encontré la matriz dispersa y la extracción de características de scikit.

http://scikit-learn.org/dev/modules/feature_extraction.html http://docs.scipy.org/doc/scipy/reference/sparse.html

Pero todavía no tengo idea de cómo usarlo. En la especificación de DBSCAN, no hay ninguna indicación sobre el uso de una matriz dispersa. ¿No está permitido?

Si alguien sabe cómo usar una matriz dispersa en DBSCAN, por favor dígamelo. O puedes decirme un método de cluster más adecuado.

Respuestas a la pregunta(4)

Su respuesta a la pregunta