Resultados da pesquisa a pedido "gensim"
PyTorch / Gensim - Como carregar incorporações de palavras pré-treinadas
Quero carregar uma incorporação word2vec pré-treinada com gensim em uma camada de incorporação PyTorch. Portanto, minha pergunta é: como obtenho os pesos de incorporação carregados pelo gensim na camada de incorporação do PyTorch. Desde já, ...
Converter arquivo bin word2vec em texto
Deword2vec [https://code.google.com/p/word2vec/]site, posso baixar o GoogleNews-vectors-negative300.bin.gz. O arquivo .bin (cerca de 3,4 GB) é um formato binário que não é útil para mim. Tomas ...
Como usar o Gensim doc2vec com vetores de palavras pré-treinados?
Recentemente, me deparei com a adição do doc2vec ao Gensim. Como posso usar vetores de palavras pré-treinados (por exemplo, encontrados no site original do word2vec) com o doc2vec? Ou o doc2vec está obtendo os vetores de palavras das mesmas ...
Gensim: TypeError: doc2bow espera uma matriz de tokens unicode na entrada, não uma única string
Estou começando com alguma tarefa python, estou enfrentando um problema ao usar o gensim. Estou tentando carregar arquivos do meu disco e processá-los (divida-os e minúsculos ()) O código que eu tenho está abaixo: dictionary_arr=[] for ...
gensim LdaMulticore não multiprocessamento?
Quando eu corro de gensimLdaMulticore modelo em uma máquina com 12 núcleos, usando: lda = LdaMulticore(corpus, num_topics=64, workers=10)Recebo uma mensagem de registro que diz using serial LDA version on this nodeAlgumas linhas depois, vejo ...
Verifique se o gensim gera o mesmo modelo Word2Vec para execuções diferentes nos mesmos dados
NoO modelo LDA gera tópicos diferentes toda vez que treino no mesmo corpus [https://stackoverflow.com/questions/15067734/lda-model-generates-different-topics-everytime-i-train-on-the-same-corpus] , definindo onp.random.seed(0), o modelo da LDA ...
É possível treinar novamente um modelo word2vec (por exemplo, GoogleNews-vectors-negative300.bin) a partir de um corpus de frases em python?
Estou usando o conjunto de dados de notícias do Google pré-treinado para obter vetores de palavras usando a biblioteca Gensim em python model = Word2Vec.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True)Depois de carregar o ...
Como extrair frases do corpus usando gensim
Para pré-processar o corpus, planejava extrair frases comuns do corpus, por isso tentei usarFrasesmodelo em gensim, tentei abaixo do código, mas não está me dando a saída desejada. Meu código from gensim.models import Phrases documents = ["the ...
Gensim word2vec em dados de dicionário e índices de palavras predefinidos
Preciso treinar uma representação word2vec em tweets usando gensim. Ao contrário da maioria dos tutoriais e códigos que eu já vi no gensim, meus dados não são brutos, mas já foram pré-processados. Eu tenho um dicionário em um documento de texto ...
word2vec como obter palavras de vetores?
Eu uso ANN para prever palavras de palavras. A entrada e a saída são todos vetores de palavras. Não sei como obter palavras da saída da RNA. A propósito, é gensim que estou usando