Resultados da pesquisa a pedido "word2vec"

5 a resposta

Atualizar o modelo gensim word2vec

Eu tenho um modelo word2vec em gensim treinado sobre 98892 documentos. Para qualquer frase que não esteja presente na matriz de frases (ou seja, o conjunto sobre o qual eu treinei o modelo), preciso atualizar o modelo com essa frase para que a ...

1 a resposta

O objeto 'arquivo' não tem atributo 'rfind' [fechado]

Estou tentando salvar um word2vec em um arquivo. model = Word2Vec(sentences, size=vector_size, window=5, min_count=5, workers=4) fo = open("foo.txt", "wb") model.save(fo)Estou recebendo o seguinte erro no genericpath.py File "word2Vec_impl.py", ...

3 a resposta

Word2Vec: Número de dimensões

Estou usando o Word2Vec com um conjunto de dados de aproximadamente 11.000.000 tokens procurando fazer as duas semelhanças de palavras (como parte da extração de sinônimos para uma tarefa a jusante), mas não tenho uma boa noção de ...

10 a resposta

Converter arquivo bin word2vec em texto

Deword2vec [https://code.google.com/p/word2vec/]site, posso baixar o GoogleNews-vectors-negative300.bin.gz. O arquivo .bin (cerca de 3,4 GB) é um formato binário que não é útil para mim. Tomas ...

4 a resposta

Como usar o Gensim doc2vec com vetores de palavras pré-treinados?

Recentemente, me deparei com a adição do doc2vec ao Gensim. Como posso usar vetores de palavras pré-treinados (por exemplo, encontrados no site original do word2vec) com o doc2vec? Ou o doc2vec está obtendo os vetores de palavras das mesmas ...

2 a resposta

word2vec: amostragem negativa (em termos leigos)?

Estou lendo o artigo abaixo e tenho alguns problemas, entendendo o conceito de amostragem negativa. http://arxiv.org/pdf/1402.3722v1.pdf [http://arxiv.org/pdf/1402.3722v1.pdf] Alguém pode ajudar por favor?

7 a resposta

Como obter vetor para uma frase da palavra 2vec de tokens na frase

Eu gerei os vetores para uma lista de tokens de um documento grande usando o word2vec. Dada uma sentença, é possível obter o vetor da sentença a partir do vetor dos tokens na sentença.

1 a resposta

Como treinar o Word2vec em conjuntos de dados muito grandes?

Estou pensando em treinar o word2vec em enormes dados em grande escala com mais de 10 TB + de tamanho no despejo de rastreamento da web. Treinei pessoalmente o dump do GoogleNews-2012 de implementação (1,5 gb) no meu iMac levou cerca de 3 horas ...

1 a resposta

Como encontrar a palavra mais próxima de um vetor usando word2vec

Acabei de começar a usar o Word2vec e fiquei imaginando como podemos encontrar a palavra mais próxima de um vetor. Eu tenho esse vetor que é o vetor médio para um conjunto de vetores: array([-0.00449447, -0.00310097, 0.02421786, ...], ...

3 a resposta

Spark Word2vec matemática de vetor

Eu estava olhando para oexemplo [http://spark.apache.org/docs/latest/mllib-feature-extraction.html#example]do site Spark para Word2Vec: val input = sc.textFile("text8").map(line => line.split(" ").toSeq) val word2vec = new Word2Vec() val model = ...