Resultados da pesquisa a pedido "word2vec"
Atualizar o modelo gensim word2vec
Eu tenho um modelo word2vec em gensim treinado sobre 98892 documentos. Para qualquer frase que não esteja presente na matriz de frases (ou seja, o conjunto sobre o qual eu treinei o modelo), preciso atualizar o modelo com essa frase para que a ...
O objeto 'arquivo' não tem atributo 'rfind' [fechado]
Estou tentando salvar um word2vec em um arquivo. model = Word2Vec(sentences, size=vector_size, window=5, min_count=5, workers=4) fo = open("foo.txt", "wb") model.save(fo)Estou recebendo o seguinte erro no genericpath.py File "word2Vec_impl.py", ...
Word2Vec: Número de dimensões
Estou usando o Word2Vec com um conjunto de dados de aproximadamente 11.000.000 tokens procurando fazer as duas semelhanças de palavras (como parte da extração de sinônimos para uma tarefa a jusante), mas não tenho uma boa noção de ...
Converter arquivo bin word2vec em texto
Deword2vec [https://code.google.com/p/word2vec/]site, posso baixar o GoogleNews-vectors-negative300.bin.gz. O arquivo .bin (cerca de 3,4 GB) é um formato binário que não é útil para mim. Tomas ...
Como usar o Gensim doc2vec com vetores de palavras pré-treinados?
Recentemente, me deparei com a adição do doc2vec ao Gensim. Como posso usar vetores de palavras pré-treinados (por exemplo, encontrados no site original do word2vec) com o doc2vec? Ou o doc2vec está obtendo os vetores de palavras das mesmas ...
word2vec: amostragem negativa (em termos leigos)?
Estou lendo o artigo abaixo e tenho alguns problemas, entendendo o conceito de amostragem negativa. http://arxiv.org/pdf/1402.3722v1.pdf [http://arxiv.org/pdf/1402.3722v1.pdf] Alguém pode ajudar por favor?
Como obter vetor para uma frase da palavra 2vec de tokens na frase
Eu gerei os vetores para uma lista de tokens de um documento grande usando o word2vec. Dada uma sentença, é possível obter o vetor da sentença a partir do vetor dos tokens na sentença.
Como treinar o Word2vec em conjuntos de dados muito grandes?
Estou pensando em treinar o word2vec em enormes dados em grande escala com mais de 10 TB + de tamanho no despejo de rastreamento da web. Treinei pessoalmente o dump do GoogleNews-2012 de implementação (1,5 gb) no meu iMac levou cerca de 3 horas ...
Como encontrar a palavra mais próxima de um vetor usando word2vec
Acabei de começar a usar o Word2vec e fiquei imaginando como podemos encontrar a palavra mais próxima de um vetor. Eu tenho esse vetor que é o vetor médio para um conjunto de vetores: array([-0.00449447, -0.00310097, 0.02421786, ...], ...
Spark Word2vec matemática de vetor
Eu estava olhando para oexemplo [http://spark.apache.org/docs/latest/mllib-feature-extraction.html#example]do site Spark para Word2Vec: val input = sc.textFile("text8").map(line => line.split(" ").toSeq) val word2vec = new Word2Vec() val model = ...