Resultados da pesquisa a pedido "gensim"
Como você inicializa uma variável de corpus gensim com um csr_matrix?
Eu tenho X como um csr_matrix que eu obtive usando vetorizador tfidf do scikit, ey que é uma matrizMeu plano é criar recursos usando o LDA, no entanto, eu nã...
gensim LdaMulticore não multiprocessamento?
Quando eu corro de gensimLdaMulticore modelo em uma máquina com 12 núcleos, usando: lda = LdaMulticore(corpus, num_topics=64, workers=10)Recebo uma mensagem de registro que diz using serial LDA version on this nodeAlgumas linhas depois, vejo ...
Como extrair frases do corpus usando gensim
Para pré-processar o corpus, planejava extrair frases comuns do corpus, por isso tentei usarFrasesmodelo em gensim, tentei abaixo do código, mas não está me dando a saída desejada. Meu código from gensim.models import Phrases documents = ["the ...
word2vec como obter palavras de vetores?
Eu uso ANN para prever palavras de palavras. A entrada e a saída são todos vetores de palavras. Não sei como obter palavras da saída da RNA. A propósito, é gensim que estou usando
Qual é a maneira mais simples de obter o tfidf com o dataframe do pandas?
Quero calcular o tf-idf a partir dos documentos abaixo. Estou usando python e pandas. import pandas as pd df = pd.DataFrame({'docId': [1,2,3], 'sent': ['This is the first sentence','This is the second sentence', 'This is the third ...
Por que vários arquivos de modelo são criados no gensim word2vec?
Quando tento criar um modelo word2vec (skipgram com amostragem negativa), recebi 3 arquivos como saída, da seguinte maneira. word2vec (File) word2vec.syn1nef.npy (NPY file) word2vec.wv.syn0.npy (NPY file) Só estou preocupado por que isso ...
aprendizado de transferência do gensim Word2vec (de um modelo não-gensim)
Eu tenho um conjunto de incorporações treinadas com uma rede neural que nada tem a ver com o word2vec de gensim. Eu quero usar esses embutimentos como pesos iniciaisgensim.Word2vec. Agora, o que eu vi é que eu possomodel.load(SOME_MODEL) e, em ...
gensim - Doc2Vec: MemoryError ao treinar na Wikipedia em inglês
Extraí 145.185.965 sentenças (14GB) do dump da wikipedia em inglês e quero treinar um modelo Doc2Vec com base nessas sentenças. Infelizmente, tenho apenas 32 GB de RAM e recebo umaMemoryError ao tentar treinar. Mesmo se eu definir o min_count ...
Como carregar frases no Python gensim?
Estou tentando usar oword2vec [http://radimrehurek.com/gensim/models/word2vec.html]módulo degensim biblioteca de processamento de linguagem natural em Python. Os documentos dizem para inicializar o modelo: from gensim.models import word2vec ...