Resultados de la búsqueda a petición "gensim"

1 la respuesta

gensim - Doc2Vec: MemoryError cuando se entrena en Wikipedia en inglés

Extraje 145,185,965 oraciones (14GB) del volcado de wikipedia en inglés y quiero entrenar un modelo Doc2Vec basado en estas oraciones. Lamentablemente, tengo 'solo' 32 GB de RAM y obtengo una MemoryError cuando intentas entrenar. Incluso si ...

4 la respuesta

PyTorch / Gensim - Cómo cargar incrustaciones de palabras pre-entrenadas

Quiero cargar una incrustación word2vec pre-entrenada con gensim en una capa de incrustación PyTorch. Entonces, mi pregunta es, ¿cómo consigo los pesos de incrustación cargados por gensim en la capa de incrustación PyTorch? ¡Gracias por adelantado!

3 la respuesta

Cómo entrenar el algoritmo GloVe en mi propio corpus

Traté de seguiresta. [https://nlp.stanford.edu/projects/glove/] Pero de alguna manera perdí mucho tiempo terminando sin nada útil. Solo quiero entrenar unGloVe modelo en mi propio corpus (~ 900Mb corpus.txt file). Descargué los archivos provistos ...

1 la respuesta

aprendizaje de transferencia gensim Word2vec (de un modelo no gensim)

Tengo un conjunto de incrustaciones entrenadas con una red neuronal que no tiene nada que ver con word2vec de gensim. Quiero usar estas incrustaciones como los pesos iniciales engensim.Word2vec. Ahora lo que vi es que ...

2 la respuesta

Usando word2vec para clasificar palabras en categorías

ANTECEDENTES Tengo vectores con algunos datos de muestra y cada vector tiene un nombre de categoría (Lugares, Colores, Nombres). ['john','jay','dan','nathan','bob'] -> 'Names' ['yellow', 'red','green'] -> 'Colors' ...

1 la respuesta

¿Por qué se crean múltiples archivos de modelo en gensim word2vec?

Cuando trato de crear un modelo word2vec (skipgram con muestreo negativo) recibí 3 archivos como resultado de la siguiente manera. word2vec (File) word2vec.syn1nef.npy (NPY file) word2vec.wv.syn0.npy (NPY file) Solo me preocupa por qué sucede ...

2 la respuesta

Error al extraer frases usando Gensim

Estoy tratando de obtener los bigrams en las oraciones usando frases en Gensim de la siguiente manera. from gensim.models import Phrases from gensim.models.phrases import Phraser documents = ["the mayor of new york was there", "machine learning ...

2 la respuesta

¿Cómo obtener una distribución completa de temas para un documento usando gensim LDA?

Cuando entreno mi modelo lda como tal dictionary = corpora.Dictionary(data) corpus = [dictionary.doc2bow(doc) for doc in data] num_cores = multiprocessing.cpu_count() num_topics = 50 lda = LdaMulticore(corpus, num_topics=num_topics, ...

2 la respuesta

Doc2Vec Sentence Clustering

Tengo múltiples documentos que contienen múltiples oraciones. Quiero usardoc2vec agrupar (por ejemplo, k-medias) los vectores de oración usandosklearn. Como tal, la idea es que oraciones similares se agrupan en varios grupos. Sin embargo, no me ...

4 la respuesta

Interpretar la suma de puntajes de palabras TF-IDF en documentos

Primero extraigamos los puntajes TF-IDF por término por documento: from gensim import corpora, models, similarities documents = ["Human machine interface for lab abc computer applications", "A survey of user opinion of computer system response ...