Resultados de la búsqueda a petición "gensim"

1 la respuesta

¿Cómo inicializar una variable de gensim corpus con un csr_matrix?

Tengo X como un csr_matrix que obtuve usando el vectorizador tfidf de scikit, y y que es una matrizMi plan es crear características utilizando LDA, sin embar...

1 la respuesta

gensim LdaMulticore no multiprocesamiento?

Cuando corro gensimLdaMulticore modelo en una máquina con 12 núcleos, utilizando: lda = LdaMulticore(corpus, num_topics=64, workers=10)Recibo un mensaje de registro que dice using serial LDA version on this nodeAlgunas líneas después, veo otro ...

1 la respuesta

Cómo extraer frases del corpus usando gensim

Para preprocesar el corpus que estaba planeando extraer frases comunes del corpus, para esto intenté usarFrasesmodelo en gensim, probé el siguiente código pero no me da el resultado deseado. Mi código from gensim.models import Phrases documents ...

1 la respuesta

word2vec ¿cómo obtener palabras de vectores?

Yo uso ANN para predecir palabras de palabras. La entrada y la salida son todas palabras vectores. No sé cómo obtener palabras de la salida de ANN. Por cierto, es gensim lo que estoy usando

1 la respuesta

¿Cuál es la forma más sencilla de obtener tfidf con el marco de datos de pandas?

Quiero calcular tf-idf a partir de los documentos a continuación. Estoy usando python y pandas. import pandas as pd df = pd.DataFrame({'docId': [1,2,3], 'sent': ['This is the first sentence','This is the second sentence', 'This is the third ...

1 la respuesta

¿Por qué se crean múltiples archivos de modelo en gensim word2vec?

Cuando trato de crear un modelo word2vec (skipgram con muestreo negativo) recibí 3 archivos como resultado de la siguiente manera. word2vec (File) word2vec.syn1nef.npy (NPY file) word2vec.wv.syn0.npy (NPY file) Solo me preocupa por qué sucede ...

1 la respuesta

aprendizaje de transferencia gensim Word2vec (de un modelo no gensim)

Tengo un conjunto de incrustaciones entrenadas con una red neuronal que no tiene nada que ver con word2vec de gensim. Quiero usar estas incrustaciones como los pesos iniciales engensim.Word2vec. Ahora lo que vi es que ...

1 la respuesta

gensim - Doc2Vec: MemoryError cuando se entrena en Wikipedia en inglés

Extraje 145,185,965 oraciones (14GB) del volcado de wikipedia en inglés y quiero entrenar un modelo Doc2Vec basado en estas oraciones. Lamentablemente, tengo 'solo' 32 GB de RAM y obtengo una MemoryError cuando intentas entrenar. Incluso si ...

2 la respuesta

Documento de distribución tópica en Gensim LDA.

He derivado un modelo de tema LDA utilizando un corpus de juguete de la siguiente manera:

2 la respuesta

Gensim: TypeError: doc2bow espera una matriz de tokens unicode en la entrada, no una sola cadena

Estoy comenzando con alguna tarea de Python, estoy enfrentando un problema mientras uso gensim. Estoy tratando de cargar archivos de mi disco y procesarlos (dividirlos y ponerlos en minúscula) El código que tengo está debajo: dictionary_arr=[] ...