В scikit-learn, DBSCAN может использовать разреженную матрицу?

Я получил ошибку памяти, когда я запускал алгоритм dbscan от scikit. Мои данные около 20000 * 10000, это двоичная матрица.

(Может быть, не подходит использовать DBSCAN с такой матрицей. Я новичок в машинном обучении. Я просто хочу найти кластерный метод, которому не нужен начальный номер кластера)

Во всяком случае я нашел разреженную матрицу и функцию извлечения scikit.

http://scikit-learn.org/dev/modules/feature_extraction.html http://docs.scipy.org/doc/scipy/reference/sparse.html

Но я до сих пор не знаю, как его использовать. В спецификации DBSCAN нет указания на использование разреженной матрицы. Разве это не разрешено?

Если кто-нибудь знает, как использовать разреженную матрицу в DBSCAN, скажите, пожалуйста. Или вы можете сказать мне более подходящий кластерный метод.

Ответы на вопрос(4)

Ваш ответ на вопрос