Resultados de la búsqueda a petición "gensim"
PyTorch / Gensim - Cómo cargar incrustaciones de palabras pre-entrenadas
Quiero cargar una incrustación word2vec pre-entrenada con gensim en una capa de incrustación PyTorch. Entonces, mi pregunta es, ¿cómo consigo los pesos de incrustación cargados por gensim en la capa de incrustación PyTorch? ¡Gracias por adelantado!
Gensim: TypeError: doc2bow espera una matriz de tokens unicode en la entrada, no una sola cadena
Estoy comenzando con alguna tarea de Python, estoy enfrentando un problema mientras uso gensim. Estoy tratando de cargar archivos de mi disco y procesarlos (dividirlos y ponerlos en minúscula) El código que tengo está debajo: dictionary_arr=[] ...
gensim LdaMulticore no multiprocesamiento?
Cuando corro gensimLdaMulticore modelo en una máquina con 12 núcleos, utilizando: lda = LdaMulticore(corpus, num_topics=64, workers=10)Recibo un mensaje de registro que dice using serial LDA version on this nodeAlgunas líneas después, veo otro ...
Asegúrese de que gensim genere el mismo modelo de Word2Vec para diferentes ejecuciones con los mismos datos
EnEl modelo LDA genera diferentes temas cada vez que entreno en el mismo corpus [https://stackoverflow.com/questions/15067734/lda-model-generates-different-topics-everytime-i-train-on-the-same-corpus] , estableciendo elnp.random.seed(0), el ...
¿Es posible volver a entrenar un modelo word2vec (por ejemplo, GoogleNews-vectors-negative300.bin) a partir de un corpus de oraciones en python?
Estoy usando el conjunto de datos de noticias de Google pre-entrenado para obtener vectores de palabras usando la biblioteca Gensim en python model = Word2Vec.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True)Después de ...
Cómo extraer frases del corpus usando gensim
Para preprocesar el corpus que estaba planeando extraer frases comunes del corpus, para esto intenté usarFrasesmodelo en gensim, probé el siguiente código pero no me da el resultado deseado. Mi código from gensim.models import Phrases documents ...
Gensim word2vec en diccionario predefinido y datos de índices de palabras
Necesito entrenar una representación de word2vec en tweets usando gensim. A diferencia de la mayoría de los tutoriales y el código que he visto en gensim, mis datos no están en bruto, pero ya han sido preprocesados. Tengo un diccionario en un ...
word2vec ¿cómo obtener palabras de vectores?
Yo uso ANN para predecir palabras de palabras. La entrada y la salida son todas palabras vectores. No sé cómo obtener palabras de la salida de ANN. Por cierto, es gensim lo que estoy usando
gensim - Doc2Vec: MemoryError cuando se entrena en Wikipedia en inglés
Extraje 145,185,965 oraciones (14GB) del volcado de wikipedia en inglés y quiero entrenar un modelo Doc2Vec basado en estas oraciones. Lamentablemente, tengo 'solo' 32 GB de RAM y obtengo una MemoryError cuando intentas entrenar. Incluso si ...