Suchergebnisse für Anfrage "gensim"
Wie initialisiert man eine Gensim-Corpus-Variable mit einer csr_matrix?
Ich habe X als csr_matrix, die ich mit scikits tfidf vectorizer erhalten habe, und y, das ein Array istMein Plan ist es, Features mit LDA zu erstellen. Ich k...
Themenverteilung: Wie sehen wir, welches Dokument zu welchem Thema gehört, nachdem wir LDA in Python durchgeführt haben?
Ich kann den LDA-Code von gensim ausführen und habe die Top-10-Themen mit den entsprechenden Schlüsselwörtern erhalten. Jetzt möchte ich noch einen Schritt weiter gehen, um zu sehen, wie genau der LDA-Algo ist, indem ich sehe, welche Dokumente ...
Aktualisieren Sie das Modell von gensim word2vec
Ich habe ein word2vec-Modell in gensim über 98892 Dokumente geschult. Für einen bestimmten Satz, der nicht im Satzarray vorhanden ist (d. H. Den Satz, über den ich das Modell trainiert habe), muss ich das Modell mit diesem Satz aktualisieren, ...
Word2vec-Bin-Datei in Text konvertieren
Von dem word2vec [https://code.google.com/p/word2vec/] site Ich kann GoogleNews-vectors-negative300.bin.gz herunterladen. Die BIN-Datei (ca. 3,4 GB) ist ein für mich nicht nützliches Binärformat. Tomas Mikolovassures ...
Wie wird Gensim doc2vec mit vorab trainierten Wortvektoren verwendet?
Ich bin kürzlich auf die doc2vec-Erweiterung von Gensim gestoßen. Wie kann ich mit doc2vec vorab trainierte Wortvektoren verwenden (z. B. die auf der ursprünglichen word2vec-Website gefundenen)? Oder ruft doc2vec die Wortvektoren aus denselben ...
Gensim: TypeError: doc2bow erwartet bei der Eingabe ein Array mit Unicode-Token, keine einzelne Zeichenfolge
Ich fange mit einer Python-Aufgabe an. Bei der Verwendung von gensim ist ein Problem aufgetreten. Ich versuche, Dateien von meiner Festplatte zu laden und zu verarbeiten (aufteilen und in Kleinbuchstaben () schreiben) Der Code, den ich habe, ...
gensim LdaMulticore nicht Multiprozessing?
Wenn ich gensim's @ laufen lasLdaMulticore Modell auf einer Maschine mit 12 Kernen unter Verwendung von: lda = LdaMulticore(corpus, num_topics=64, workers=10)Ich erhalte eine Protokollmeldung mit der Aufschrift using serial LDA version on this ...
Stellen Sie sicher, dass das gensim dasselbe Word2Vec-Modell für verschiedene Läufe mit denselben Daten generiert.
ImLDA-Modell generiert jedes Mal unterschiedliche Themen, wenn ich auf demselben Korpus trainiere. [https://stackoverflow.com/questions/15067734/lda-model-generates-different-topics-everytime-i-train-on-the-same-corpus] , indem Sie ...
Seite 1 von 2