Как gensim вычисляет векторы абзаца doc2vec

Question

Nov 04, 2016, 02:18 AM

gensim doc2vec nlp word2vec vectorization

Как gensim вычисляет векторы абзаца doc2vec

я иду через эту статьюhttp://cs.stanford.edu/~quocle/paragraph_vector.pdf

и говорится, что

«Вектор параграфа и векторы слова усредняются или объединяются, чтобы предсказать следующее слово в контексте. В экспериментах мы используем конкатенацию как метод объединения векторов».

Как работает конкатенация или усреднение?

пример (если абзац 1 содержит слова 1 и 2):

word1 vector =[0.1,0.2,0.3]
word2 vector =[0.4,0.5,0.6]

concat method 
does paragraph vector = [0.1+0.4,0.2+0.5,0.3+0.6] ?

Average method 
does paragraph vector = [(0.1+0.4)/2,(0.2+0.5)/2,(0.3+0.6)/2] ?

Также из этого изображения:

Заявлено, что:

Маркер абзаца можно представить как другое слово. Он действует как память, которая запоминает то, чего не хватает в текущем контексте или в теме абзаца. По этой причине мы часто называем эту модель моделью распределенной памяти векторов абзацев (PV-DM).

Токен абзаца равен вектору абзаца, который равенon?

Как gensim вычисляет векторы абзаца doc2vec

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Как gensim вычисляет векторы абзаца doc2vec

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы