Resultados de la búsqueda a petición "gensim"
gensim - Doc2Vec: MemoryError cuando se entrena en Wikipedia en inglés
Extraje 145,185,965 oraciones (14GB) del volcado de wikipedia en inglés y quiero entrenar un modelo Doc2Vec basado en estas oraciones. Lamentablemente, tengo 'solo' 32 GB de RAM y obtengo una MemoryError cuando intentas entrenar. Incluso si ...
PyTorch / Gensim - Cómo cargar incrustaciones de palabras pre-entrenadas
Quiero cargar una incrustación word2vec pre-entrenada con gensim en una capa de incrustación PyTorch. Entonces, mi pregunta es, ¿cómo consigo los pesos de incrustación cargados por gensim en la capa de incrustación PyTorch? ¡Gracias por adelantado!
Cómo entrenar el algoritmo GloVe en mi propio corpus
Traté de seguiresta. [https://nlp.stanford.edu/projects/glove/] Pero de alguna manera perdí mucho tiempo terminando sin nada útil. Solo quiero entrenar unGloVe modelo en mi propio corpus (~ 900Mb corpus.txt file). Descargué los archivos provistos ...
aprendizaje de transferencia gensim Word2vec (de un modelo no gensim)
Tengo un conjunto de incrustaciones entrenadas con una red neuronal que no tiene nada que ver con word2vec de gensim. Quiero usar estas incrustaciones como los pesos iniciales engensim.Word2vec. Ahora lo que vi es que ...
Usando word2vec para clasificar palabras en categorías
ANTECEDENTES Tengo vectores con algunos datos de muestra y cada vector tiene un nombre de categoría (Lugares, Colores, Nombres). ['john','jay','dan','nathan','bob'] -> 'Names' ['yellow', 'red','green'] -> 'Colors' ...
¿Por qué se crean múltiples archivos de modelo en gensim word2vec?
Cuando trato de crear un modelo word2vec (skipgram con muestreo negativo) recibí 3 archivos como resultado de la siguiente manera. word2vec (File) word2vec.syn1nef.npy (NPY file) word2vec.wv.syn0.npy (NPY file) Solo me preocupa por qué sucede ...
Error al extraer frases usando Gensim
Estoy tratando de obtener los bigrams en las oraciones usando frases en Gensim de la siguiente manera. from gensim.models import Phrases from gensim.models.phrases import Phraser documents = ["the mayor of new york was there", "machine learning ...
¿Cómo obtener una distribución completa de temas para un documento usando gensim LDA?
Cuando entreno mi modelo lda como tal dictionary = corpora.Dictionary(data) corpus = [dictionary.doc2bow(doc) for doc in data] num_cores = multiprocessing.cpu_count() num_topics = 50 lda = LdaMulticore(corpus, num_topics=num_topics, ...
Doc2Vec Sentence Clustering
Tengo múltiples documentos que contienen múltiples oraciones. Quiero usardoc2vec agrupar (por ejemplo, k-medias) los vectores de oración usandosklearn. Como tal, la idea es que oraciones similares se agrupan en varios grupos. Sin embargo, no me ...
Interpretar la suma de puntajes de palabras TF-IDF en documentos
Primero extraigamos los puntajes TF-IDF por término por documento: from gensim import corpora, models, similarities documents = ["Human machine interface for lab abc computer applications", "A survey of user opinion of computer system response ...