Wie berechnet gensim doc2vec-Absatzvektoren

Ich gehe durch dieses Papierhttp: //cs.stanford.edu/~quocle/paragraph_vector.pd

nd es besagt, dass

"Der Absatzvektor und die Wortvektoren werden gemittelt oder verkettet, um das nächste Wort in einem Kontext vorherzusagen. In den Experimenten wird die Verkettung als Methode zum Kombinieren der Vektoren verwendet."

Wie funktioniert die Verkettung oder Mittelung?

Beispiel (wenn Absatz 1 Wort1 und Wort2 enthält):

word1 vector =[0.1,0.2,0.3]
word2 vector =[0.4,0.5,0.6]

concat method 
does paragraph vector = [0.1+0.4,0.2+0.5,0.3+0.6] ?

Average method 
does paragraph vector = [(0.1+0.4)/2,(0.2+0.5)/2,(0.3+0.6)/2] ?

Auch von diesem Bild:

Es wird angegeben, daß

Das Absatz-Token kann als ein anderes Wort angesehen werden. Es fungiert als Erinnerung daran, was im aktuellen Kontext fehlt - oder an das Thema des Absatzes. Aus diesem Grund wird dieses Modell häufig als verteiltes Speichermodell von Absatzvektoren (PV-DM) bezeichnet.

Ist das Absatz-Token gleich dem Absatzvektor, der gleich @ ion?

Antworten auf die Frage(4)

Ihre Antwort auf die Frage