W scikit-learn, czy DBSCAN może używać rzadkiej macierzy?
Wystąpił błąd pamięci, gdy korzystałem z algorytmu scscit dbscan. Moje dane to około 20000 * 10000, to macierz binarna.
(Może nie nadaje się do używania DBSCAN z taką macierzą. Jestem początkującym uczeniem maszynowym. Chcę tylko znaleźć metodę klastrową, która nie potrzebuje początkowego numeru klastra)
W każdym razie znalazłem rzadką matrycę i ekstrakcję funkcji scikit.
http://scikit-learn.org/dev/modules/feature_extraction.html http://docs.scipy.org/doc/scipy/reference/sparse.html
Ale nadal nie mam pojęcia, jak go używać. W specyfikacji DBSCAN nie ma żadnych wskazówek dotyczących używania rzadkiej macierzy. Czy to nie jest dozwolone?
Jeśli ktoś wie, jak używać rzadkiej macierzy w DBSCAN, proszę mi powiedzieć. Lub możesz mi powiedzieć bardziej odpowiednią metodę klastrowania.