Suchergebnisse für Anfrage "word2vec"

5 die antwort

Aktualisieren Sie das Modell von gensim word2vec

Ich habe ein word2vec-Modell in gensim über 98892 Dokumente geschult. Für einen bestimmten Satz, der nicht im Satzarray vorhanden ist (d. H. Den Satz, über den ich das Modell trainiert habe), muss ich das Modell mit diesem Satz aktualisieren, ...

1 die antwort

'file' Objekt hat kein Attribut 'rfind' [geschlossen]

Ich versuche, ein word2vec in eine Datei zu speichern. model = Word2Vec(sentences, size=vector_size, window=5, min_count=5, workers=4) fo = open("foo.txt", "wb") model.save(fo)In genericpath.py wird der folgende Fehler angezeigt File ...

3 die antwort

Word2Vec: Anzahl der Dimensionen

Ich verwende Word2Vec mit einem Datensatz von ungefähr 11.000.000 Token, um Ähnlichkeiten zwischen beiden Wörtern zu erzielen (als Teil der Synonymextraktion für eine nachgelagerte Aufgabe), aber ich verstehe nicht, wie viele Dimensionen ich mit ...

TOP-Veröffentlichungen

20 die antwort

Word2vec-Bin-Datei in Text konvertieren

Von dem word2vec [https://code.google.com/p/word2vec/] site Ich kann GoogleNews-vectors-negative300.bin.gz herunterladen. Die BIN-Datei (ca. 3,4 GB) ist ein für mich nicht nützliches Binärformat. Tomas Mikolovassures ...

8 die antwort

Wie wird Gensim doc2vec mit vorab trainierten Wortvektoren verwendet?

Ich bin kürzlich auf die doc2vec-Erweiterung von Gensim gestoßen. Wie kann ich mit doc2vec vorab trainierte Wortvektoren verwenden (z. B. die auf der ursprünglichen word2vec-Website gefundenen)? Oder ruft doc2vec die Wortvektoren aus denselben ...

4 die antwort

word2vec: negative Abtastung (in Laienform)?

Ich lese die nachstehende Abhandlung und habe Probleme, das Konzept der Negativabtastung zu verstehen. http: //arxiv.org/pdf/1402.3722v1.pd [http://arxiv.org/pdf/1402.3722v1.pdf] ann mir jemand helfen, bitt

14 die antwort

Wie bekomme ich einen Vektor für einen Satz aus dem word2vec von Tokens im Satz

Ich habe die Vektoren für eine Liste von Tokens mit word2vec aus einem großen Dokument generiert. Bei einem gegebenen Satz ist es möglich, den Vektor des Satzes aus dem Vektor der Tokens im Satz zu erhalten.

2 die antwort

Wie trainiere ich Word2vec mit sehr großen Datenmengen?

Ich denke daran, word2vec auf riesigen Datenmengen mit einer Größe von mehr als 10 TB auf einem Web-Crawler-Dump zu trainieren. Ich habe die Implementierung des GoogleNews-2012-Dumps (1,5 GB) auf meinem iMac persönlich geschult. Das Trainieren ...

6 die antwort

Spark Word2vec Vektor Mathematik

Ich war auf der Suche nachBeispie [http://spark.apache.org/docs/latest/mllib-feature-extraction.html#example] der Spark-Site für Word2Vec: val input = sc.textFile("text8").map(line => line.split(" ").toSeq) val word2vec = new Word2Vec() val ...

6 die antwort

Stellen Sie sicher, dass das gensim dasselbe Word2Vec-Modell für verschiedene Läufe mit denselben Daten generiert.

ImLDA-Modell generiert jedes Mal unterschiedliche Themen, wenn ich auf demselben Korpus trainiere. [https://stackoverflow.com/questions/15067734/lda-model-generates-different-topics-everytime-i-train-on-the-same-corpus] , indem Sie ...