Resultados de la búsqueda a petición "gensim"

2 la respuesta

Doc2Vec Sentence Clustering

Tengo múltiples documentos que contienen múltiples oraciones. Quiero usardoc2vec agrupar (por ejemplo, k-medias) los vectores de oración usandosklearn. Como tal, la idea es que oraciones similares se agrupan en varios grupos. Sin embargo, no me ...

2 la respuesta

Error al extraer frases usando Gensim

Estoy tratando de obtener los bigrams en las oraciones usando frases en Gensim de la siguiente manera. from gensim.models import Phrases from gensim.models.phrases import Phraser documents = ["the mayor of new york was there", "machine learning ...

5 la respuesta

Actualización del modelo gensim word2vec

Tengo un modelo word2vec en gensim entrenado en más de 98892 documentos. Para cualquier oración dada que no esté presente en la matriz de oraciones (es decir, el conjunto sobre el que entrené el modelo), necesito actualizar el modelo con esa ...

1 la respuesta

¿Por qué se crean múltiples archivos de modelo en gensim word2vec?

Cuando trato de crear un modelo word2vec (skipgram con muestreo negativo) recibí 3 archivos como resultado de la siguiente manera. word2vec (File) word2vec.syn1nef.npy (NPY file) word2vec.wv.syn0.npy (NPY file) Solo me preocupa por qué sucede ...

2 la respuesta

¿Cómo obtener una distribución completa de temas para un documento usando gensim LDA?

Cuando entreno mi modelo lda como tal dictionary = corpora.Dictionary(data) corpus = [dictionary.doc2bow(doc) for doc in data] num_cores = multiprocessing.cpu_count() num_topics = 50 lda = LdaMulticore(corpus, num_topics=num_topics, ...

2 la respuesta

Usando word2vec para clasificar palabras en categorías

ANTECEDENTES Tengo vectores con algunos datos de muestra y cada vector tiene un nombre de categoría (Lugares, Colores, Nombres). ['john','jay','dan','nathan','bob'] -> 'Names' ['yellow', 'red','green'] -> 'Colors' ...

1 la respuesta

aprendizaje de transferencia gensim Word2vec (de un modelo no gensim)

Tengo un conjunto de incrustaciones entrenadas con una red neuronal que no tiene nada que ver con word2vec de gensim. Quiero usar estas incrustaciones como los pesos iniciales engensim.Word2vec. Ahora lo que vi es que ...

3 la respuesta

Cómo entrenar el algoritmo GloVe en mi propio corpus

Traté de seguiresta. [https://nlp.stanford.edu/projects/glove/] Pero de alguna manera perdí mucho tiempo terminando sin nada útil. Solo quiero entrenar unGloVe modelo en mi propio corpus (~ 900Mb corpus.txt file). Descargué los archivos provistos ...

10 la respuesta

Convierta el archivo bin de word2vec a texto

Desde elword2vec [https://code.google.com/p/word2vec/]sitio puedo descargar GoogleNews-vectors-negative300.bin.gz. El archivo .bin (aproximadamente 3.4GB) es un formato binario que no me es útil. Tomás Mikolovnos ...

4 la respuesta

¿Cómo usar Gensim doc2vec con vectores de palabras previamente entrenados?

Recientemente me encontré con la adición de doc2vec a Gensim. ¿Cómo puedo usar vectores de palabras previamente capacitados (por ejemplo, que se encuentran en el sitio web original de word2vec) con doc2vec? ¿O es que doc2vec obtiene los vectores ...