Resultados de la búsqueda a petición "topic-modeling"
¿Deseas eliminar los documentos vacíos de DocumentTermMatrix en R topicmodels?
Estoy haciendo modelado de temas usando el paquete de modelos de tema en R. Estoy creando un objeto de Corpus, haciendo un preprocesamiento básico y luego cr...
¿Cómo imprimo el modelo de tema lda y la nube de palabras de cada uno de los temas?
from nltk.tokenize import RegexpTokenizer from stop_words import get_stop_words from gensim import corpora, models import gensim import os from os import path from time import sleep import matplotlib.pyplot as plt import random from wordcloud ...
Error de memoria en python usando una matriz numpy
Recibo el siguiente error para este código: model = lda.LDA(n_topics=15, n_iter=50, random_state=1) model.fit(X) topic_word = model.topic_word_ print("type(topic_word): {}".format(type(topic_word))) print("shape: {}".format(topic_word.shape)) ...
Intentar eliminar palabras de un DocumentTermMatrix para usar los modelos de tema
Por lo tanto, estoy tratando de usar el
Spark MLlib LDA, ¿cómo inferir la distribución de temas de un nuevo documento invisible?
Estoy interesado en aplicar el modelado de temas LDA usando Spark MLlib. He comprobado el código y las explicaciones enaquí [http://spark.apache.org/docs/latest/mllib-clustering.html#latent-dirichlet-allocation-lda] pero no pude encontrar cómo ...
¿Hacer que gsub solo reemplace palabras enteras?
(Estoy usando R.) Para una lista de palabras que se llama "goodwords.corpus", estoy recorriendo los documentos en un corpus y reemplazando cada una de las palabras en la lista "goodwords.corpus" con la palabra + a número. Entonces, por ejemplo, ...