Suchergebnisse für Anfrage "gensim"

9 die antwort

Wie werden die LDA-Themenmodelle von gensim gedruckt? Python

Verwenden

1 die antwort

Wie initialisiert man eine Gensim-Corpus-Variable mit einer csr_matrix?

Ich habe X als csr_matrix, die ich mit scikits tfidf vectorizer erhalten habe, und y, das ein Array istMein Plan ist es, Features mit LDA zu erstellen. Ich k...

2 die antwort

Dokument aktuelle Verteilung in Gensim LDA

TOP-Veröffentlichungen

3 die antwort

Themenverteilung: Wie sehen wir, welches Dokument zu welchem Thema gehört, nachdem wir LDA in Python durchgeführt haben?

Ich kann den LDA-Code von gensim ausführen und habe die Top-10-Themen mit den entsprechenden Schlüsselwörtern erhalten. Jetzt möchte ich noch einen Schritt weiter gehen, um zu sehen, wie genau der LDA-Algo ist, indem ich sehe, welche Dokumente ...

5 die antwort

Aktualisieren Sie das Modell von gensim word2vec

Ich habe ein word2vec-Modell in gensim über 98892 Dokumente geschult. Für einen bestimmten Satz, der nicht im Satzarray vorhanden ist (d. H. Den Satz, über den ich das Modell trainiert habe), muss ich das Modell mit diesem Satz aktualisieren, ...

20 die antwort

Word2vec-Bin-Datei in Text konvertieren

Von dem word2vec [https://code.google.com/p/word2vec/] site Ich kann GoogleNews-vectors-negative300.bin.gz herunterladen. Die BIN-Datei (ca. 3,4 GB) ist ein für mich nicht nützliches Binärformat. Tomas Mikolovassures ...

8 die antwort

Wie wird Gensim doc2vec mit vorab trainierten Wortvektoren verwendet?

Ich bin kürzlich auf die doc2vec-Erweiterung von Gensim gestoßen. Wie kann ich mit doc2vec vorab trainierte Wortvektoren verwenden (z. B. die auf der ursprünglichen word2vec-Website gefundenen)? Oder ruft doc2vec die Wortvektoren aus denselben ...

4 die antwort

Gensim: TypeError: doc2bow erwartet bei der Eingabe ein Array mit Unicode-Token, keine einzelne Zeichenfolge

Ich fange mit einer Python-Aufgabe an. Bei der Verwendung von gensim ist ein Problem aufgetreten. Ich versuche, Dateien von meiner Festplatte zu laden und zu verarbeiten (aufteilen und in Kleinbuchstaben () schreiben) Der Code, den ich habe, ...

2 die antwort

gensim LdaMulticore nicht Multiprozessing?

Wenn ich gensim's @ laufen lasLdaMulticore Modell auf einer Maschine mit 12 Kernen unter Verwendung von: lda = LdaMulticore(corpus, num_topics=64, workers=10)Ich erhalte eine Protokollmeldung mit der Aufschrift using serial LDA version on this ...

6 die antwort

Stellen Sie sicher, dass das gensim dasselbe Word2Vec-Modell für verschiedene Läufe mit denselben Daten generiert.

ImLDA-Modell generiert jedes Mal unterschiedliche Themen, wenn ich auf demselben Korpus trainiere. [https://stackoverflow.com/questions/15067734/lda-model-generates-different-topics-everytime-i-train-on-the-same-corpus] , indem Sie ...