Resultados de la búsqueda a petición "gensim"
Gensim word2vec en diccionario predefinido y datos de índices de palabras
Necesito entrenar una representación de word2vec en tweets usando gensim. A diferencia de la mayoría de los tutoriales y el código que he visto en gensim, mis datos no están en bruto, pero ya han sido preprocesados. Tengo un diccionario en un ...
Comprender la salida de Doc2Vec del paquete Gensim
Tengo algunas oraciones de muestra que quiero ejecutar a través de un modelo Doc2Vec. Mi objetivo final es una matriz de tamaño (num_sentences, num_features). Estoy usando el paquete Gensim. from gensim.models.doc2vec import TaggedDocument from ...
¿Cómo calcula gensim los vectores de párrafo doc2vec?
voy a seguir este papelhttp://cs.stanford.edu/~quocle/paragraph_vector.pdf [http://cs.stanford.edu/~quocle/paragraph_vector.pdf] y dice que "El vector de párrafo y los vectores de palabras se promedian o concatenan para predecir la siguiente ...
¿Cómo ejecutar tsne en word2vec creado a partir de gensim?
Quiero visualizar un word2vec creado a partir de la biblioteca gensim. Intenté sklearn pero parece que necesito instalar una versión de desarrollador para obtenerlo. Intenté instalar la versión de desarrollador pero eso no funciona en mi máquina. ...
Doc2Vec Sentence Clustering
Tengo múltiples documentos que contienen múltiples oraciones. Quiero usardoc2vec agrupar (por ejemplo, k-medias) los vectores de oración usandosklearn. Como tal, la idea es que oraciones similares se agrupan en varios grupos. Sin embargo, no me ...
¿Cómo obtener una distribución completa de temas para un documento usando gensim LDA?
Cuando entreno mi modelo lda como tal dictionary = corpora.Dictionary(data) corpus = [dictionary.doc2bow(doc) for doc in data] num_cores = multiprocessing.cpu_count() num_topics = 50 lda = LdaMulticore(corpus, num_topics=num_topics, ...
Error al extraer frases usando Gensim
Estoy tratando de obtener los bigrams en las oraciones usando frases en Gensim de la siguiente manera. from gensim.models import Phrases from gensim.models.phrases import Phraser documents = ["the mayor of new york was there", "machine learning ...
Usando word2vec para clasificar palabras en categorías
ANTECEDENTES Tengo vectores con algunos datos de muestra y cada vector tiene un nombre de categoría (Lugares, Colores, Nombres). ['john','jay','dan','nathan','bob'] -> 'Names' ['yellow', 'red','green'] -> 'Colors' ...
Distribución de temas: ¿Cómo vemos qué documento pertenece a qué tema después de hacer LDA en python?
Soy capaz de ejecutar el código LDA desde gensim y obtuve los 10 temas principales con sus respectivas palabras clave.Ahora me gustaría ir un paso más allá p...
Asegúrese de que gensim genere el mismo modelo de Word2Vec para diferentes ejecuciones con los mismos datos
EnEl modelo LDA genera diferentes temas cada vez que entreno en el mismo corpus [https://stackoverflow.com/questions/15067734/lda-model-generates-different-topics-everytime-i-train-on-the-same-corpus] , estableciendo elnp.random.seed(0), el ...