Resultados da pesquisa a pedido "gensim"

4 a resposta

PyTorch / Gensim - Como carregar incorporações de palavras pré-treinadas

Quero carregar uma incorporação word2vec pré-treinada com gensim em uma camada de incorporação PyTorch. Portanto, minha pergunta é: como obtenho os pesos de incorporação carregados pelo gensim na camada de incorporação do PyTorch. Desde já, ...

10 a resposta

Converter arquivo bin word2vec em texto

Deword2vec [https://code.google.com/p/word2vec/]site, posso baixar o GoogleNews-vectors-negative300.bin.gz. O arquivo .bin (cerca de 3,4 GB) é um formato binário que não é útil para mim. Tomas ...

4 a resposta

Como usar o Gensim doc2vec com vetores de palavras pré-treinados?

Recentemente, me deparei com a adição do doc2vec ao Gensim. Como posso usar vetores de palavras pré-treinados (por exemplo, encontrados no site original do word2vec) com o doc2vec? Ou o doc2vec está obtendo os vetores de palavras das mesmas ...

2 a resposta

Gensim: TypeError: doc2bow espera uma matriz de tokens unicode na entrada, não uma única string

Estou começando com alguma tarefa python, estou enfrentando um problema ao usar o gensim. Estou tentando carregar arquivos do meu disco e processá-los (divida-os e minúsculos ()) O código que eu tenho está abaixo: dictionary_arr=[] for ...

1 a resposta

gensim LdaMulticore não multiprocessamento?

Quando eu corro de gensimLdaMulticore modelo em uma máquina com 12 núcleos, usando: lda = LdaMulticore(corpus, num_topics=64, workers=10)Recebo uma mensagem de registro que diz using serial LDA version on this nodeAlgumas linhas depois, vejo ...

3 a resposta

Verifique se o gensim gera o mesmo modelo Word2Vec para execuções diferentes nos mesmos dados

NoO modelo LDA gera tópicos diferentes toda vez que treino no mesmo corpus [https://stackoverflow.com/questions/15067734/lda-model-generates-different-topics-everytime-i-train-on-the-same-corpus] , definindo onp.random.seed(0), o modelo da LDA ...

3 a resposta

É possível treinar novamente um modelo word2vec (por exemplo, GoogleNews-vectors-negative300.bin) a partir de um corpus de frases em python?

Estou usando o conjunto de dados de notícias do Google pré-treinado para obter vetores de palavras usando a biblioteca Gensim em python model = Word2Vec.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True)Depois de carregar o ...

1 a resposta

Como extrair frases do corpus usando gensim

Para pré-processar o corpus, planejava extrair frases comuns do corpus, por isso tentei usarFrasesmodelo em gensim, tentei abaixo do código, mas não está me dando a saída desejada. Meu código from gensim.models import Phrases documents = ["the ...

2 a resposta

Gensim word2vec em dados de dicionário e índices de palavras predefinidos

Preciso treinar uma representação word2vec em tweets usando gensim. Ao contrário da maioria dos tutoriais e códigos que eu já vi no gensim, meus dados não são brutos, mas já foram pré-processados. Eu tenho um dicionário em um documento de texto ...

1 a resposta

word2vec como obter palavras de vetores?

Eu uso ANN para prever palavras de palavras. A entrada e a saída são todos vetores de palavras. Não sei como obter palavras da saída da RNA. A propósito, é gensim que estou usando