Suchergebnisse für Anfrage "gensim"

2 die antwort

Wie man mit gensim @ Phrasen aus dem Korpus extrahie

Für die Vorverarbeitung des Korpus plante ich, gebräuchliche Ausdrücke aus dem Korpus zu entfernen. Dazu habe ich versucht, @ zu verwendeSätz Modell in gensim, ich habe versucht, unter Code, aber es gibt mir nicht die gewünschte Ausgabe. Mein ...

2 die antwort

gensim LdaMulticore nicht Multiprozessing?

Wenn ich gensim's @ laufen lasLdaMulticore Modell auf einer Maschine mit 12 Kernen unter Verwendung von: lda = LdaMulticore(corpus, num_topics=64, workers=10)Ich erhalte eine Protokollmeldung mit der Aufschrift using serial LDA version on this ...

20 die antwort

Word2vec-Bin-Datei in Text konvertieren

Von dem word2vec [https://code.google.com/p/word2vec/] site Ich kann GoogleNews-vectors-negative300.bin.gz herunterladen. Die BIN-Datei (ca. 3,4 GB) ist ein für mich nicht nützliches Binärformat. Tomas Mikolovassures ...

TOP-Veröffentlichungen

9 die antwort

Wie werden die LDA-Themenmodelle von gensim gedruckt? Python

Verwenden

4 die antwort

Gensim word2vec für vordefinierte Wörterbuch- und Wortindexdaten

Ich muss eine word2vec-Darstellung auf Tweets mit gensim trainieren. Im Gegensatz zu den meisten Tutorials und Codes, die ich auf gensim gesehen habe, sind meine Daten nicht roh, sondern wurden bereits vorverarbeitet. Ich habe ein Wörterbuch in ...

6 die antwort

Stellen Sie sicher, dass das gensim dasselbe Word2Vec-Modell für verschiedene Läufe mit denselben Daten generiert.

ImLDA-Modell generiert jedes Mal unterschiedliche Themen, wenn ich auf demselben Korpus trainiere. [https://stackoverflow.com/questions/15067734/lda-model-generates-different-topics-everytime-i-train-on-the-same-corpus] , indem Sie ...

2 die antwort

Was ist der einfachste Weg, um tfidf mit pandas dataframe zu bekommen?

Ich möchte tf-idf aus den folgenden Dokumenten berechnen. Ich benutze Python und Pandas. import pandas as pd df = pd.DataFrame({'docId': [1,2,3], 'sent': ['This is the first sentence','This is the second sentence', 'This is the third ...

2 die antwort

Dokument aktuelle Verteilung in Gensim LDA

5 die antwort

Aktualisieren Sie das Modell von gensim word2vec

Ich habe ein word2vec-Modell in gensim über 98892 Dokumente geschult. Für einen bestimmten Satz, der nicht im Satzarray vorhanden ist (d. H. Den Satz, über den ich das Modell trainiert habe), muss ich das Modell mit diesem Satz aktualisieren, ...

4 die antwort

Wie berechnet gensim doc2vec-Absatzvektoren

Ich gehe durch dieses Papierhttp: //cs.stanford.edu/~quocle/paragraph_vector.pd [http://cs.stanford.edu/~quocle/paragraph_vector.pdf] nd es besagt, dass "Der Absatzvektor und die Wortvektoren werden gemittelt oder verkettet, um das nächste ...