Resultados de la búsqueda a petición "gensim"

9 la respuesta

¿Cómo imprimir los modelos de temas LDA desde gensim? Pitón

Utilizando

1 la respuesta

¿Cómo inicializar una variable de gensim corpus con un csr_matrix?

Tengo X como un csr_matrix que obtuve usando el vectorizador tfidf de scikit, y y que es una matrizMi plan es crear características utilizando LDA, sin embar...

2 la respuesta

Documento de distribución tópica en Gensim LDA.

He derivado un modelo de tema LDA utilizando un corpus de juguete de la siguiente manera:

3 la respuesta

Distribución de temas: ¿Cómo vemos qué documento pertenece a qué tema después de hacer LDA en python?

Soy capaz de ejecutar el código LDA desde gensim y obtuve los 10 temas principales con sus respectivas palabras clave.Ahora me gustaría ir un paso más allá p...

5 la respuesta

Actualización del modelo gensim word2vec

Tengo un modelo word2vec en gensim entrenado en más de 98892 documentos. Para cualquier oración dada que no esté presente en la matriz de oraciones (es decir, el conjunto sobre el que entrené el modelo), necesito actualizar el modelo con esa ...

10 la respuesta

Convierta el archivo bin de word2vec a texto

Desde elword2vec [https://code.google.com/p/word2vec/]sitio puedo descargar GoogleNews-vectors-negative300.bin.gz. El archivo .bin (aproximadamente 3.4GB) es un formato binario que no me es útil. Tomás Mikolovnos ...

4 la respuesta

¿Cómo usar Gensim doc2vec con vectores de palabras previamente entrenados?

Recientemente me encontré con la adición de doc2vec a Gensim. ¿Cómo puedo usar vectores de palabras previamente capacitados (por ejemplo, que se encuentran en el sitio web original de word2vec) con doc2vec? ¿O es que doc2vec obtiene los vectores ...

2 la respuesta

Gensim: TypeError: doc2bow espera una matriz de tokens unicode en la entrada, no una sola cadena

Estoy comenzando con alguna tarea de Python, estoy enfrentando un problema mientras uso gensim. Estoy tratando de cargar archivos de mi disco y procesarlos (dividirlos y ponerlos en minúscula) El código que tengo está debajo: dictionary_arr=[] ...

1 la respuesta

gensim LdaMulticore no multiprocesamiento?

Cuando corro gensimLdaMulticore modelo en una máquina con 12 núcleos, utilizando: lda = LdaMulticore(corpus, num_topics=64, workers=10)Recibo un mensaje de registro que dice using serial LDA version on this nodeAlgunas líneas después, veo otro ...

3 la respuesta

Asegúrese de que gensim genere el mismo modelo de Word2Vec para diferentes ejecuciones con los mismos datos

EnEl modelo LDA genera diferentes temas cada vez que entreno en el mismo corpus [https://stackoverflow.com/questions/15067734/lda-model-generates-different-topics-everytime-i-train-on-the-same-corpus] , estableciendo elnp.random.seed(0), el ...