Результаты поиска по запросу "gensim"

2 ответа

Актуальная рассылка документов в Gensim LDA

Я вывел тематическую модель LDA, используя игрушечный корпус, следующим образом: documents = ['Human machine interface for lab abc computer applications', 'A survey of user opinion of computer system response time', 'The EPS user interface ...

3 ответа

Распределение тем: Как мы видим, какой документ относится к какой теме после выполнения LDA в Python

Я могу запустить код LDA от Gensim и получил топ-10 тем с соответствующими ключевыми словами. Теперь я хотел бы сделать шаг вперед, чтобы увидеть, насколько точным является алгоритм LDA, посмотрев, какой документ они объединяют в каждую тему. ...

2 ответа

Используйте больше данных ...

аюсь получить биграммы в предложениях, используя фразы в Gensim следующим образом. from gensim.models import Phrases from gensim.models.phrases import Phraser documents = ["the mayor of new york was there", "machine learning can be ...

ТОП публикаций

1 ответ

Как вы инициализируете переменную gensim corpus с помощью csr_matrix?

У меня есть X в качестве csr_matrix, который я получил с помощью векторизатора tfidf от scikit, а y - массив Мой план состоит в том, чтобы создавать функции с использованием LDA, однако мне не удалось найти, как инициализировать переменную ...

3 ответа

Убедитесь, что ваш файл корпуса имеет правильный формат. Вам нужно будет подготовить свой корпус как один текстовый файл со всеми словами, разделенными одним или несколькими пробелами или табуляцией. Если в вашем корпусе несколько документов, документы (только) должны быть разделены символами новой строки.

ался следоватьэто. [https://nlp.stanford.edu/projects/glove/] Но кое-как, как я потратил много времени, ничего не получилось. Я просто хочу тренироватьGloVe модель на моем собственном корпусе (файл ~ 900Mb corpus.txt). Я скачал файлы, указанные в ...

2 ответа

Gensim: TypeError: doc2bow ожидает массив входных токенов Unicode, а не одну строку

2 ответа

 перчатки в эти дни.

меня есть векторы с некоторыми образцами данных, и у каждого вектора есть название категории (Места, Цвета, Имена). Моя цель - обучить модель, которая принимает новую входную строку и предсказывать, к какой категории она принадлежит. Например, ...

2 ответа

Как запустить tsne на word2vec, созданном из gensim?

Я хочу визуализировать word2vec, созданный из библиотеки gensim. Я попробовал sklearn, но, кажется, мне нужно установить версию для разработчиков, чтобы полу...

2 ответа

Понимание вывода Doc2Vec из пакета Gensim

У меня есть несколько примеров предложений, которые я хочу выполнить через модель Doc2Vec. Моя конечная цель - матрица размера (num_sentences, num_features)....

2 ответа

Актуальная рассылка документов в Gensim LDA

Мы вывели тематическую модель LDA с использованием игрушечного корпуса следующим образом: