No scikit-learn, o DBSCAN pode usar matriz esparsa?

Eu tenho erro de memória quando eu estava executando o algoritmo dbscan do scikit. Meus dados são cerca de 20000 * 10000, é uma matriz binária.

(Talvez não seja adequado usar o DBSCAN com essa matriz. Eu sou um iniciante em aprendizado de máquina. Eu só quero encontrar um método de cluster que não precise de um número de cluster inicial)

Enfim encontrei matriz esparsa e extração de recursos do scikit.

http://scikit-learn.org/dev/modules/feature_extraction.html http://docs.scipy.org/doc/scipy/reference/sparse.html

Mas ainda não tenho ideia de como usá-lo. Na especificação do DBSCAN, não há indicação sobre o uso de matriz esparsa. Não é permitido?

Se alguém souber como usar a matriz esparsa no DBSCAN, por favor me diga. Ou você pode me dizer um método de cluster mais adequado.

questionAnswers(4)

yourAnswerToTheQuestion