Resultados da pesquisa a pedido "gensim"

1 a resposta

Como você inicializa uma variável de corpus gensim com um csr_matrix?

Eu tenho X como um csr_matrix que eu obtive usando vetorizador tfidf do scikit, ey que é uma matrizMeu plano é criar recursos usando o LDA, no entanto, eu nã...

1 a resposta

gensim LdaMulticore não multiprocessamento?

Quando eu corro de gensimLdaMulticore modelo em uma máquina com 12 núcleos, usando: lda = LdaMulticore(corpus, num_topics=64, workers=10)Recebo uma mensagem de registro que diz using serial LDA version on this nodeAlgumas linhas depois, vejo ...

1 a resposta

Como extrair frases do corpus usando gensim

Para pré-processar o corpus, planejava extrair frases comuns do corpus, por isso tentei usarFrasesmodelo em gensim, tentei abaixo do código, mas não está me dando a saída desejada. Meu código from gensim.models import Phrases documents = ["the ...

1 a resposta

word2vec como obter palavras de vetores?

Eu uso ANN para prever palavras de palavras. A entrada e a saída são todos vetores de palavras. Não sei como obter palavras da saída da RNA. A propósito, é gensim que estou usando

1 a resposta

Qual é a maneira mais simples de obter o tfidf com o dataframe do pandas?

Quero calcular o tf-idf a partir dos documentos abaixo. Estou usando python e pandas. import pandas as pd df = pd.DataFrame({'docId': [1,2,3], 'sent': ['This is the first sentence','This is the second sentence', 'This is the third ...

1 a resposta

Por que vários arquivos de modelo são criados no gensim word2vec?

Quando tento criar um modelo word2vec (skipgram com amostragem negativa), recebi 3 arquivos como saída, da seguinte maneira. word2vec (File) word2vec.syn1nef.npy (NPY file) word2vec.wv.syn0.npy (NPY file) Só estou preocupado por que isso ...

1 a resposta

aprendizado de transferência do gensim Word2vec (de um modelo não-gensim)

Eu tenho um conjunto de incorporações treinadas com uma rede neural que nada tem a ver com o word2vec de gensim. Eu quero usar esses embutimentos como pesos iniciaisgensim.Word2vec. Agora, o que eu vi é que eu possomodel.load(SOME_MODEL) e, em ...

1 a resposta

gensim - Doc2Vec: MemoryError ao treinar na Wikipedia em inglês

Extraí 145.185.965 sentenças (14GB) do dump da wikipedia em inglês e quero treinar um modelo Doc2Vec com base nessas sentenças. Infelizmente, tenho apenas 32 GB de RAM e recebo umaMemoryError ao tentar treinar. Mesmo se eu definir o min_count ...

2 a resposta

Distribuição tópica de documentos em Gensim LDA

2 a resposta

Como carregar frases no Python gensim?

Estou tentando usar oword2vec [http://radimrehurek.com/gensim/models/word2vec.html]módulo degensim biblioteca de processamento de linguagem natural em Python. Os documentos dizem para inicializar o modelo: from gensim.models import word2vec ...