Como você inicializa uma variável de corpus gensim com um csr_matrix?
Eu tenho X como um csr_matrix que eu obtive usando vetorizador tfidf do scikit, ey que é uma matriz
Meu plano é criar recursos usando o LDA, no entanto, eu não consegui encontrar como inicializar a variável de corpus do gensim com X como um csr_matrix. Em outras palavras, eu não quero baixar um corpus como mostrado na documentação do gensim nem converter X em uma matriz densa, já que consumiria muita memória e o computador poderia travar.
Em suma, minhas perguntas são as seguintes,
Como você inicializa um corpus gensim dado que eu tenho um csr_matrix (esparso) representando todo o corpus?Como você usa o LDA para extrair recursos?