Resultados da pesquisa a pedido "word2vec"

2 a resposta

Gensim word2vec em dados de dicionário e índices de palavras predefinidos

Preciso treinar uma representação word2vec em tweets usando gensim. Ao contrário da maioria dos tutoriais e códigos que eu já vi no gensim, meus dados não são brutos, mas já foram pré-processados. Eu tenho um dicionário em um documento de texto ...

2 a resposta

word2vec: amostragem negativa (em termos leigos)?

Estou lendo o artigo abaixo e tenho alguns problemas, entendendo o conceito de amostragem negativa. http://arxiv.org/pdf/1402.3722v1.pdf [http://arxiv.org/pdf/1402.3722v1.pdf] Alguém pode ajudar por favor?

2 a resposta

Como executar tsne no word2vec criado a partir de gensim?

Eu quero visualizar um word2vec criado a partir da biblioteca gensim. Eu tentei o sklearn, mas parece que preciso instalar uma versão do desenvolvedor para obtê-lo. Tentei instalar a versão do desenvolvedor, mas isso não está funcionando na minha ...

5 a resposta

Atualizar o modelo gensim word2vec

Eu tenho um modelo word2vec em gensim treinado sobre 98892 documentos. Para qualquer frase que não esteja presente na matriz de frases (ou seja, o conjunto sobre o qual eu treinei o modelo), preciso atualizar o modelo com essa frase para que a ...

3 a resposta

Spark Word2vec matemática de vetor

Eu estava olhando para oexemplo [http://spark.apache.org/docs/latest/mllib-feature-extraction.html#example]do site Spark para Word2Vec: val input = sc.textFile("text8").map(line => line.split(" ").toSeq) val word2vec = new Word2Vec() val model = ...

2 a resposta

O que significa uma incorporação de palavra ponderada?

Nopapel [http://www.aclweb.org/anthology/S17-2100]que estou tentando implementar, diz, Neste trabalho, os tweets foram modelados usando três tipos de representação de texto. O primeiro é um modelo de saco de palavras ponderado por ...

4 a resposta

Como usar o Gensim doc2vec com vetores de palavras pré-treinados?

Recentemente, me deparei com a adição do doc2vec ao Gensim. Como posso usar vetores de palavras pré-treinados (por exemplo, encontrados no site original do word2vec) com o doc2vec? Ou o doc2vec está obtendo os vetores de palavras das mesmas ...

1 a resposta

Como treinar o Word2vec em conjuntos de dados muito grandes?

Estou pensando em treinar o word2vec em enormes dados em grande escala com mais de 10 TB + de tamanho no despejo de rastreamento da web. Treinei pessoalmente o dump do GoogleNews-2012 de implementação (1,5 gb) no meu iMac levou cerca de 3 horas ...

3 a resposta

Tensorflow: modelo Word2vec CBOW

Eu sou novo no tensorflow e no word2vec. Eu apenas estudei oword2vec_basic.py [https://github.com/tensorflow/tensorflow/blob/r0.8/tensorflow/examples/tutorials/word2vec/word2vec_basic.py] que treina o modelo usandoSkip-Gram algoritmo. Agora eu ...

7 a resposta

Como obter vetor para uma frase da palavra 2vec de tokens na frase

Eu gerei os vetores para uma lista de tokens de um documento grande usando o word2vec. Dada uma sentença, é possível obter o vetor da sentença a partir do vetor dos tokens na sentença.