Resultados da pesquisa a pedido "topic-modeling"
Erro de memória em python usando matriz numpy
Estou recebendo o seguinte erro para este código: model = lda.LDA(n_topics=15, n_iter=50, random_state=1) model.fit(X) topic_word = model.topic_word_ print("type(topic_word): {}".format(type(topic_word))) print("shape: ...
Como reproduzir resultados exatos com a função LDA no pacote topicmodels do R
Não consegui criar resultados reproduzíveis a partir da função LDA do topicmodels. Para dar um exemplo de sua documentação: library(topicmodels) set.seed(0) lda1 <- LDA(AssociatedPress[1:20, ], control=list(seed=0), k=2) set.seed(0) lda2 <- ...
Fazer o gsub substituir apenas palavras inteiras?
(Estou usando R.) Para uma lista de palavras chamada "goodwords.corpus", estou percorrendo os documentos em um corpus e substituindo cada uma das palavras da lista "goodwords.corpus" pela palavra + a número. Por exemplo, se a palavra "bom" ...
Remover documentos vazios do DocumentTermMatrix em R topicmodels?
Estou fazendo modelagem de tópico usando o pacote topicmodels em R. Estou criando um objeto Corpus, fazendo um pré-processamento básico e, em seguida, criand...
Como imprimo o modelo de tópico lda e a nuvem de palavras de cada um dos tópicos
from nltk.tokenize import RegexpTokenizer from stop_words import get_stop_words from gensim import corpora, models import gensim import os from os import path from time import sleep import matplotlib.pyplot as plt import random from wordcloud ...
Spark MLlib LDA, como inferir a distribuição de tópicos de um novo documento invisível?
Estou interessado em aplicar a modelagem de tópicos LDA usando o Spark MLlib. Eu verifiquei o código e as explicações emaqui [http://spark.apache.org/docs/latest/mllib-clustering.html#latent-dirichlet-allocation-lda] mas não consegui encontrar ...