Resultados de la búsqueda a petición "gensim"

4 la respuesta

PyTorch / Gensim - Cómo cargar incrustaciones de palabras pre-entrenadas

Quiero cargar una incrustación word2vec pre-entrenada con gensim en una capa de incrustación PyTorch. Entonces, mi pregunta es, ¿cómo consigo los pesos de incrustación cargados por gensim en la capa de incrustación PyTorch? ¡Gracias por adelantado!

2 la respuesta

Gensim: TypeError: doc2bow espera una matriz de tokens unicode en la entrada, no una sola cadena

Estoy comenzando con alguna tarea de Python, estoy enfrentando un problema mientras uso gensim. Estoy tratando de cargar archivos de mi disco y procesarlos (dividirlos y ponerlos en minúscula) El código que tengo está debajo: dictionary_arr=[] ...

1 la respuesta

gensim LdaMulticore no multiprocesamiento?

Cuando corro gensimLdaMulticore modelo en una máquina con 12 núcleos, utilizando: lda = LdaMulticore(corpus, num_topics=64, workers=10)Recibo un mensaje de registro que dice using serial LDA version on this nodeAlgunas líneas después, veo otro ...

3 la respuesta

Asegúrese de que gensim genere el mismo modelo de Word2Vec para diferentes ejecuciones con los mismos datos

EnEl modelo LDA genera diferentes temas cada vez que entreno en el mismo corpus [https://stackoverflow.com/questions/15067734/lda-model-generates-different-topics-everytime-i-train-on-the-same-corpus] , estableciendo elnp.random.seed(0), el ...

3 la respuesta

¿Es posible volver a entrenar un modelo word2vec (por ejemplo, GoogleNews-vectors-negative300.bin) a partir de un corpus de oraciones en python?

Estoy usando el conjunto de datos de noticias de Google pre-entrenado para obtener vectores de palabras usando la biblioteca Gensim en python model = Word2Vec.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True)Después de ...

1 la respuesta

Cómo extraer frases del corpus usando gensim

Para preprocesar el corpus que estaba planeando extraer frases comunes del corpus, para esto intenté usarFrasesmodelo en gensim, probé el siguiente código pero no me da el resultado deseado. Mi código from gensim.models import Phrases documents ...

2 la respuesta

Gensim word2vec en diccionario predefinido y datos de índices de palabras

Necesito entrenar una representación de word2vec en tweets usando gensim. A diferencia de la mayoría de los tutoriales y el código que he visto en gensim, mis datos no están en bruto, pero ya han sido preprocesados. Tengo un diccionario en un ...

1 la respuesta

word2vec ¿cómo obtener palabras de vectores?

Yo uso ANN para predecir palabras de palabras. La entrada y la salida son todas palabras vectores. No sé cómo obtener palabras de la salida de ANN. Por cierto, es gensim lo que estoy usando

1 la respuesta

gensim - Doc2Vec: MemoryError cuando se entrena en Wikipedia en inglés

Extraje 145,185,965 oraciones (14GB) del volcado de wikipedia en inglés y quiero entrenar un modelo Doc2Vec basado en estas oraciones. Lamentablemente, tengo 'solo' 32 GB de RAM y obtengo una MemoryError cuando intentas entrenar. Incluso si ...