Suchergebnisse für Anfrage "word2vec"
Aktualisieren Sie das Modell von gensim word2vec
Ich habe ein word2vec-Modell in gensim über 98892 Dokumente geschult. Für einen bestimmten Satz, der nicht im Satzarray vorhanden ist (d. H. Den Satz, über den ich das Modell trainiert habe), muss ich das Modell mit diesem Satz aktualisieren, ...
'file' Objekt hat kein Attribut 'rfind' [geschlossen]
Ich versuche, ein word2vec in eine Datei zu speichern. model = Word2Vec(sentences, size=vector_size, window=5, min_count=5, workers=4) fo = open("foo.txt", "wb") model.save(fo)In genericpath.py wird der folgende Fehler angezeigt File ...
Word2Vec: Anzahl der Dimensionen
Ich verwende Word2Vec mit einem Datensatz von ungefähr 11.000.000 Token, um Ähnlichkeiten zwischen beiden Wörtern zu erzielen (als Teil der Synonymextraktion für eine nachgelagerte Aufgabe), aber ich verstehe nicht, wie viele Dimensionen ich mit ...
Word2vec-Bin-Datei in Text konvertieren
Von dem word2vec [https://code.google.com/p/word2vec/] site Ich kann GoogleNews-vectors-negative300.bin.gz herunterladen. Die BIN-Datei (ca. 3,4 GB) ist ein für mich nicht nützliches Binärformat. Tomas Mikolovassures ...
Wie wird Gensim doc2vec mit vorab trainierten Wortvektoren verwendet?
Ich bin kürzlich auf die doc2vec-Erweiterung von Gensim gestoßen. Wie kann ich mit doc2vec vorab trainierte Wortvektoren verwenden (z. B. die auf der ursprünglichen word2vec-Website gefundenen)? Oder ruft doc2vec die Wortvektoren aus denselben ...
word2vec: negative Abtastung (in Laienform)?
Ich lese die nachstehende Abhandlung und habe Probleme, das Konzept der Negativabtastung zu verstehen. http: //arxiv.org/pdf/1402.3722v1.pd [http://arxiv.org/pdf/1402.3722v1.pdf] ann mir jemand helfen, bitt
Wie bekomme ich einen Vektor für einen Satz aus dem word2vec von Tokens im Satz
Ich habe die Vektoren für eine Liste von Tokens mit word2vec aus einem großen Dokument generiert. Bei einem gegebenen Satz ist es möglich, den Vektor des Satzes aus dem Vektor der Tokens im Satz zu erhalten.
Wie trainiere ich Word2vec mit sehr großen Datenmengen?
Ich denke daran, word2vec auf riesigen Datenmengen mit einer Größe von mehr als 10 TB auf einem Web-Crawler-Dump zu trainieren. Ich habe die Implementierung des GoogleNews-2012-Dumps (1,5 GB) auf meinem iMac persönlich geschult. Das Trainieren ...
Spark Word2vec Vektor Mathematik
Ich war auf der Suche nachBeispie [http://spark.apache.org/docs/latest/mllib-feature-extraction.html#example] der Spark-Site für Word2Vec: val input = sc.textFile("text8").map(line => line.split(" ").toSeq) val word2vec = new Word2Vec() val ...
Stellen Sie sicher, dass das gensim dasselbe Word2Vec-Modell für verschiedene Läufe mit denselben Daten generiert.
ImLDA-Modell generiert jedes Mal unterschiedliche Themen, wenn ich auf demselben Korpus trainiere. [https://stackoverflow.com/questions/15067734/lda-model-generates-different-topics-everytime-i-train-on-the-same-corpus] , indem Sie ...
Seite 1 von 2