Resultados da pesquisa a pedido "topic-modeling"
Fazer o gsub substituir apenas palavras inteiras?
(Estou usando R.) Para uma lista de palavras chamada "goodwords.corpus", estou percorrendo os documentos em um corpus e substituindo cada uma das palavras da lista "goodwords.corpus" pela palavra + a número. Por exemplo, se a palavra "bom" ...
Remover documentos vazios do DocumentTermMatrix em R topicmodels?
Estou fazendo modelagem de tópico usando o pacote topicmodels em R. Estou criando um objeto Corpus, fazendo um pré-processamento básico e, em seguida, criand...
Spark MLlib LDA, como inferir a distribuição de tópicos de um novo documento invisível?
Estou interessado em aplicar a modelagem de tópicos LDA usando o Spark MLlib. Eu verifiquei o código e as explicações emaqui [http://spark.apache.org/docs/latest/mllib-clustering.html#latent-dirichlet-allocation-lda] mas não consegui encontrar ...
Erro de memória em python usando matriz numpy
Estou recebendo o seguinte erro para este código: model = lda.LDA(n_topics=15, n_iter=50, random_state=1) model.fit(X) topic_word = model.topic_word_ print("type(topic_word): {}".format(type(topic_word))) print("shape: ...
Como reproduzir resultados exatos com a função LDA no pacote topicmodels do R
Não consegui criar resultados reproduzíveis a partir da função LDA do topicmodels. Para dar um exemplo de sua documentação: library(topicmodels) set.seed(0) lda1 <- LDA(AssociatedPress[1:20, ], control=list(seed=0), k=2) set.seed(0) lda2 <- ...
Como imprimo o modelo de tópico lda e a nuvem de palavras de cada um dos tópicos
from nltk.tokenize import RegexpTokenizer from stop_words import get_stop_words from gensim import corpora, models import gensim import os from os import path from time import sleep import matplotlib.pyplot as plt import random from wordcloud ...