Результаты поиска по запросу "word2vec"

2 ответа

Как запустить tsne на word2vec, созданном из gensim?

Я хочу визуализировать word2vec, созданный из библиотеки gensim. Я попробовал sklearn, но, кажется, мне нужно установить версию для разработчиков, чтобы полу...

2 ответа

Используйте больше данных ...

аюсь получить биграммы в предложениях, используя фразы в Gensim следующим образом. from gensim.models import Phrases from gensim.models.phrases import Phraser documents = ["the mayor of new york was there", "machine learning can be ...

1 ответ

и другие свойства, которые могут храниться как отдельные файлы.

я пытаюсь создать модель word2vec (скипграмма с отрицательной выборкой), я получил 3 файла в следующем виде. word2vec (File) word2vec.syn1nef.npy (NPY file) word2vec.wv.syn0.npy (NPY file)Я просто волнуюсь, почему это происходит, так как для ...

ТОП публикаций

1 ответ

Это очень легко реализовать и использовать, у вас есть формула в статье, но в двух словах, вектор предложения просто V = sum_i ^ k = 1 Posweight (w_i) * IDFWeight (w_i) * V_i

агачто я пытаюсь реализовать, это говорит, [http://www.aclweb.org/anthology/S17-2100]В этой работе твиты были смоделированы с использованием трех типов текстового представления. Первая - это модель пакета слов, взвешенная по tf-idf (термин ...

2 ответа

 перчатки в эти дни.

меня есть векторы с некоторыми образцами данных, и у каждого вектора есть название категории (Места, Цвета, Имена). Моя цель - обучить модель, которая принимает новую входную строку и предсказывать, к какой категории она принадлежит. Например, ...

1 ответ

 экземпляр.

я есть набор встраиваний, обученных с помощью нейронной сети, которая не имеет ничего общего с gensim's word2vec. Я хочу использовать эти вложения в качестве начальных весов вgensim.Word2vec. Теперь я вижу, что могуmodel.load(SOME_MODEL) и ...

3 ответа

Убедитесь, что ваш файл корпуса имеет правильный формат. Вам нужно будет подготовить свой корпус как один текстовый файл со всеми словами, разделенными одним или несколькими пробелами или табуляцией. Если в вашем корпусе несколько документов, документы (только) должны быть разделены символами новой строки.

ался следоватьэто. [https://nlp.stanford.edu/projects/glove/] Но кое-как, как я потратил много времени, ничего не получилось. Я просто хочу тренироватьGloVe модель на моем собственном корпусе (файл ~ 900Mb corpus.txt). Я скачал файлы, указанные в ...