Jak zainicjować zmienną gensim corpus za pomocą csr_matrix?
Mam X jako csr_matrix, który otrzymałem za pomocą skryptu wektorowego tfidf scikit i y, który jest tablicą
Moim planem jest stworzenie funkcji przy użyciu LDA, jednak nie udało mi się znaleźć sposobu na zainicjowanie zmiennej korpusowej gensim za pomocą X jako csr_matrix. Innymi słowy, nie chcę pobierać korpusu, jak pokazano w dokumentacji gensim, ani nie konwertować X na gęstą matrycę, ponieważ zużywałoby to dużo pamięci i komputer mógł się zawiesić.
Krótko mówiąc, moje pytania są następujące:
Jak zainicjować korpus gensim, skoro mam csr_matrix (rzadki) reprezentujący cały korpus?Jak używać LDA do wyodrębniania funkcji?