Как вы инициализируете переменную gensim corpus с помощью csr_matrix?
У меня есть X в качестве csr_matrix, который я получил с помощью scikit 's tfidf vectorizer, а y - массив
Я планирую создавать функции с использованием LDA, однако мне не удалось найти способ инициализации gensim 's корпусная переменная с X в качестве csr_matrix. Другими словами, я нене хочу загружать корпус, как показано в gensim 's документацию и не конвертируйте X в плотную матрицу, так как это потребовало бы много памяти, и компьютер мог зависнуть.
Короче говоря, мои вопросы следующие,
Как вы инициализируете корпус gensim, учитывая, что у меня есть csr_matrix (разреженный), представляющий весь корпус?Как вы используете LDA для извлечения функций?