Результаты поиска по запросу "gensim"

2 ответа

 предложения, которые вы могли бы вывести infer_vector (), используя вашу модель, а затем определить, к какому кластеру он относится в вашей кластеризации sklearn

я есть несколько документов, которые содержат несколько предложений. Я хочу использоватьdoc2vec кластеризовать (например, k-means) векторы предложений, испол...

0 ответов

После обучения вашей модели LDA, если вы хотите получить все разделы документа, не ограничиваясь более низким порогом, вы должны установить для параметра limit_probability значение 0 при вызове метода get_document_topics.

я тренирую свою модель LDA как таковую dictionary = corpora.Dictionary(data) corpus = [dictionary.doc2bow(doc) for doc in data] num_cores = multiprocessing.cpu_count() num_topics = 50 lda = LdaMulticore(corpus, num_topics=num_topics, ...

2 ответа

Используйте больше данных ...

аюсь получить биграммы в предложениях, используя фразы в Gensim следующим образом. from gensim.models import Phrases from gensim.models.phrases import Phraser documents = ["the mayor of new york was there", "machine learning can be ...

ТОП публикаций

1 ответ

и другие свойства, которые могут храниться как отдельные файлы.

я пытаюсь создать модель word2vec (скипграмма с отрицательной выборкой), я получил 3 файла в следующем виде. word2vec (File) word2vec.syn1nef.npy (NPY file) word2vec.wv.syn0.npy (NPY file)Я просто волнуюсь, почему это происходит, так как для ...

2 ответа

 перчатки в эти дни.

меня есть векторы с некоторыми образцами данных, и у каждого вектора есть название категории (Места, Цвета, Имена). Моя цель - обучить модель, которая принимает новую входную строку и предсказывать, к какой категории она принадлежит. Например, ...

1 ответ

 экземпляр.

я есть набор встраиваний, обученных с помощью нейронной сети, которая не имеет ничего общего с gensim's word2vec. Я хочу использовать эти вложения в качестве начальных весов вgensim.Word2vec. Теперь я вижу, что могуmodel.load(SOME_MODEL) и ...

3 ответа

Убедитесь, что ваш файл корпуса имеет правильный формат. Вам нужно будет подготовить свой корпус как один текстовый файл со всеми словами, разделенными одним или несколькими пробелами или табуляцией. Если в вашем корпусе несколько документов, документы (только) должны быть разделены символами новой строки.

ался следоватьэто. [https://nlp.stanford.edu/projects/glove/] Но кое-как, как я потратил много времени, ничего не получилось. Я просто хочу тренироватьGloVe модель на моем собственном корпусе (файл ~ 900Mb corpus.txt). Я скачал файлы, указанные в ...

3 ответа

Я просто указывал, что в этом сценарии использования векторы на самом деле не прошли предварительную подготовку. В вашем примере кода он не загружает предварительно обученные векторы, а вместо этого обучает новые векторы слов. И мне было просто интересно, есть ли другой вариант использования, поэтому я спрашивал.

у загрузить предварительно обученное встраивание word2vec с помощью gensim в слой встраивания PyTorch. Поэтому мой вопрос заключается в том, как мне получить веса внедрения, загруженные gensim в слой внедрения PyTorch. Заранее спасибо!

1 ответ

 ). Да, от 0,025 до 0,0001 - это выбор по умолчанию / общий альфа.

лек 145 185 965 предложений (14 ГБ) из дампа английской Википедии и хочу обучить модель Doc2Vec на основе этих предложений. К сожалению, у меня «только» 32 ГБ оперативной памяти и я получаюMemoryError при попытке тренироваться. Даже если ...

2 ответа

Как загрузить предложения в Python Gensim?

Я пытаюсь использоватьword2vec [http://radimrehurek.com/gensim/models/word2vec.html]модуль изgensim библиотека обработки естественного языка в Python. Документы говорят, чтобы инициализировать модель: from gensim.models import word2vec model = ...