Resultados de la búsqueda a petición "word2vec"

2 la respuesta

Usando word2vec para clasificar palabras en categorías

ANTECEDENTES Tengo vectores con algunos datos de muestra y cada vector tiene un nombre de categoría (Lugares, Colores, Nombres). ['john','jay','dan','nathan','bob'] -> 'Names' ['yellow', 'red','green'] -> 'Colors' ...

1 la respuesta

aprendizaje de transferencia gensim Word2vec (de un modelo no gensim)

Tengo un conjunto de incrustaciones entrenadas con una red neuronal que no tiene nada que ver con word2vec de gensim. Quiero usar estas incrustaciones como los pesos iniciales engensim.Word2vec. Ahora lo que vi es que ...

2 la respuesta

¿Qué significa incrustar una palabra ponderada?

En elpapel [http://www.aclweb.org/anthology/S17-2100]que estoy tratando de implementar, dice: En este trabajo, los tweets se modelaron utilizando tres tipos de representación de texto. El primero es un modelo de bolsa de palabras ponderado por ...

1 la respuesta

El objeto 'archivo' no tiene atributo 'rfind' [cerrado]

Estoy tratando de guardar un word2vec en un archivo. model = Word2Vec(sentences, size=vector_size, window=5, min_count=5, workers=4) fo = open("foo.txt", "wb") model.save(fo)Recibo el siguiente error en genericpath.py File "word2Vec_impl.py", ...

3 la respuesta

Cómo entrenar el algoritmo GloVe en mi propio corpus

Traté de seguiresta. [https://nlp.stanford.edu/projects/glove/] Pero de alguna manera perdí mucho tiempo terminando sin nada útil. Solo quiero entrenar unGloVe modelo en mi propio corpus (~ 900Mb corpus.txt file). Descargué los archivos provistos ...

3 la respuesta

Word2Vec: número de dimensiones

Estoy usando Word2Vec con un conjunto de datos de aproximadamente 11,000,000 tokens que buscan similitud de ambas palabras (como parte de la extracción de sinónimos para una tarea posterior) pero no tengo una buena idea de cuántas dimensiones ...

10 la respuesta

Convierta el archivo bin de word2vec a texto

Desde elword2vec [https://code.google.com/p/word2vec/]sitio puedo descargar GoogleNews-vectors-negative300.bin.gz. El archivo .bin (aproximadamente 3.4GB) es un formato binario que no me es útil. Tomás Mikolovnos ...

4 la respuesta

¿Cómo usar Gensim doc2vec con vectores de palabras previamente entrenados?

Recientemente me encontré con la adición de doc2vec a Gensim. ¿Cómo puedo usar vectores de palabras previamente capacitados (por ejemplo, que se encuentran en el sitio web original de word2vec) con doc2vec? ¿O es que doc2vec obtiene los vectores ...

7 la respuesta

Cómo obtener el vector para una oración de la palabra2vec de tokens en la oración

He generado los vectores para una lista de tokens de un documento grande usando word2vec. Dada una oración, ¿es posible obtener el vector de la oración del vector de los tokens en la oración?

1 la respuesta

¿Cómo entrenar Word2vec en conjuntos de datos muy grandes?

Estoy pensando en entrenar word2vec en datos a gran escala de más de 10 TB + de tamaño en el volcado de rastreo web. Personalmente entrené el volcado de implementación de GoogleNews-2012 (1.5 gb) en mi iMac, tardé aproximadamente 3 horas en ...