Результаты поиска по запросу "gensim"

1 ответ

word2vec как получить слова из векторов?

Я использую ANN, чтобы предсказать слова из слов. Вход и выход - все слова-векторы. Я не знаю, как получить слова из выхода ANN. Кстати, это Gensim я использую

2 ответа

Как gensim вычисляет векторы абзаца doc2vec

3 ответа

Что означает синтаксис «слово в слово» в Python?

Я вижу следующий фрагмент сценария изстраница учебника Gensim [http://radimrehurek.com/gensim/tut1.html]. Каков синтаксисслово в словониже сценарий Python? >> texts = [[word for word in document.lower().split() if word not in stoplist] >> for ...

ТОП публикаций

3 ответа

Убедитесь, что ваш файл корпуса имеет правильный формат. Вам нужно будет подготовить свой корпус как один текстовый файл со всеми словами, разделенными одним или несколькими пробелами или табуляцией. Если в вашем корпусе несколько документов, документы (только) должны быть разделены символами новой строки.

ался следоватьэто. [https://nlp.stanford.edu/projects/glove/] Но кое-как, как я потратил много времени, ничего не получилось. Я просто хочу тренироватьGloVe модель на моем собственном корпусе (файл ~ 900Mb corpus.txt). Я скачал файлы, указанные в ...

1 ответ

Как извлечь фразы из корпуса с помощью gensim

Для предварительной обработки корпуса я планировал вычеркнуть из корпуса общие фразы, для этого я попытался использоватьфразы Модель в Gensim, я попробовал к...

0 ответов

После обучения вашей модели LDA, если вы хотите получить все разделы документа, не ограничиваясь более низким порогом, вы должны установить для параметра limit_probability значение 0 при вызове метода get_document_topics.

я тренирую свою модель LDA как таковую dictionary = corpora.Dictionary(data) corpus = [dictionary.doc2bow(doc) for doc in data] num_cores = multiprocessing.cpu_count() num_topics = 50 lda = LdaMulticore(corpus, num_topics=num_topics, ...

2 ответа

 предложения, которые вы могли бы вывести infer_vector (), используя вашу модель, а затем определить, к какому кластеру он относится в вашей кластеризации sklearn

я есть несколько документов, которые содержат несколько предложений. Я хочу использоватьdoc2vec кластеризовать (например, k-means) векторы предложений, испол...

2 ответа

Актуальная рассылка документов в Gensim LDA

Я вывел тематическую модель LDA, используя игрушечный корпус, следующим образом: documents = ['Human machine interface for lab abc computer applications', 'A survey of user opinion of computer system response time', 'The EPS user interface ...

2 ответа

Gensim: TypeError: doc2bow ожидает массив входных токенов Unicode, а не одну строку

1 ответ

и другие свойства, которые могут храниться как отдельные файлы.

я пытаюсь создать модель word2vec (скипграмма с отрицательной выборкой), я получил 3 файла в следующем виде. word2vec (File) word2vec.syn1nef.npy (NPY file) word2vec.wv.syn0.npy (NPY file)Я просто волнуюсь, почему это происходит, так как для ...