Resultados de la búsqueda a petición "gensim"

2 la respuesta

Gensim word2vec en diccionario predefinido y datos de índices de palabras

Necesito entrenar una representación de word2vec en tweets usando gensim. A diferencia de la mayoría de los tutoriales y el código que he visto en gensim, mis datos no están en bruto, pero ya han sido preprocesados. Tengo un diccionario en un ...

2 la respuesta

Comprender la salida de Doc2Vec del paquete Gensim

Tengo algunas oraciones de muestra que quiero ejecutar a través de un modelo Doc2Vec. Mi objetivo final es una matriz de tamaño (num_sentences, num_features). Estoy usando el paquete Gensim. from gensim.models.doc2vec import TaggedDocument from ...

2 la respuesta

¿Cómo calcula gensim los vectores de párrafo doc2vec?

voy a seguir este papelhttp://cs.stanford.edu/~quocle/paragraph_vector.pdf [http://cs.stanford.edu/~quocle/paragraph_vector.pdf] y dice que "El vector de párrafo y los vectores de palabras se promedian o concatenan para predecir la siguiente ...

2 la respuesta

¿Cómo ejecutar tsne en word2vec creado a partir de gensim?

Quiero visualizar un word2vec creado a partir de la biblioteca gensim. Intenté sklearn pero parece que necesito instalar una versión de desarrollador para obtenerlo. Intenté instalar la versión de desarrollador pero eso no funciona en mi máquina. ...

2 la respuesta

Doc2Vec Sentence Clustering

Tengo múltiples documentos que contienen múltiples oraciones. Quiero usardoc2vec agrupar (por ejemplo, k-medias) los vectores de oración usandosklearn. Como tal, la idea es que oraciones similares se agrupan en varios grupos. Sin embargo, no me ...

2 la respuesta

¿Cómo obtener una distribución completa de temas para un documento usando gensim LDA?

Cuando entreno mi modelo lda como tal dictionary = corpora.Dictionary(data) corpus = [dictionary.doc2bow(doc) for doc in data] num_cores = multiprocessing.cpu_count() num_topics = 50 lda = LdaMulticore(corpus, num_topics=num_topics, ...

2 la respuesta

Error al extraer frases usando Gensim

Estoy tratando de obtener los bigrams en las oraciones usando frases en Gensim de la siguiente manera. from gensim.models import Phrases from gensim.models.phrases import Phraser documents = ["the mayor of new york was there", "machine learning ...

2 la respuesta

Usando word2vec para clasificar palabras en categorías

ANTECEDENTES Tengo vectores con algunos datos de muestra y cada vector tiene un nombre de categoría (Lugares, Colores, Nombres). ['john','jay','dan','nathan','bob'] -> 'Names' ['yellow', 'red','green'] -> 'Colors' ...

3 la respuesta

Distribución de temas: ¿Cómo vemos qué documento pertenece a qué tema después de hacer LDA en python?

Soy capaz de ejecutar el código LDA desde gensim y obtuve los 10 temas principales con sus respectivas palabras clave.Ahora me gustaría ir un paso más allá p...

3 la respuesta

Asegúrese de que gensim genere el mismo modelo de Word2Vec para diferentes ejecuciones con los mismos datos

EnEl modelo LDA genera diferentes temas cada vez que entreno en el mismo corpus [https://stackoverflow.com/questions/15067734/lda-model-generates-different-topics-everytime-i-train-on-the-same-corpus] , estableciendo elnp.random.seed(0), el ...