Resultados da pesquisa a pedido "topic-modeling"

2 a resposta

Fazer o gsub substituir apenas palavras inteiras?

(Estou usando R.) Para uma lista de palavras chamada "goodwords.corpus", estou percorrendo os documentos em um corpus e substituindo cada uma das palavras da lista "goodwords.corpus" pela palavra + a número. Por exemplo, se a palavra "bom" ...

5 a resposta

Remover documentos vazios do DocumentTermMatrix em R topicmodels?

Estou fazendo modelagem de tópico usando o pacote topicmodels em R. Estou criando um objeto Corpus, fazendo um pré-processamento básico e, em seguida, criand...

1 a resposta

Tentando remover palavras de um DocumentTermMatrix para usar topicmodels

1 a resposta

Spark MLlib LDA, como inferir a distribuição de tópicos de um novo documento invisível?

Estou interessado em aplicar a modelagem de tópicos LDA usando o Spark MLlib. Eu verifiquei o código e as explicações emaqui [http://spark.apache.org/docs/latest/mllib-clustering.html#latent-dirichlet-allocation-lda] mas não consegui encontrar ...

1 a resposta

Implementando Modelo de Tópico com Python (numpy)

1 a resposta

Erro de memória em python usando matriz numpy

Estou recebendo o seguinte erro para este código: model = lda.LDA(n_topics=15, n_iter=50, random_state=1) model.fit(X) topic_word = model.topic_word_ print("type(topic_word): {}".format(type(topic_word))) print("shape: ...

1 a resposta

Como reproduzir resultados exatos com a função LDA no pacote topicmodels do R

Não consegui criar resultados reproduzíveis a partir da função LDA do topicmodels. Para dar um exemplo de sua documentação: library(topicmodels) set.seed(0) lda1 <- LDA(AssociatedPress[1:20, ], control=list(seed=0), k=2) set.seed(0) lda2 <- ...

9 a resposta

Como imprimir os modelos de tópicos do LDA a partir do gensim? Python

Usando

2 a resposta

Como imprimo o modelo de tópico lda e a nuvem de palavras de cada um dos tópicos

from nltk.tokenize import RegexpTokenizer from stop_words import get_stop_words from gensim import corpora, models import gensim import os from os import path from time import sleep import matplotlib.pyplot as plt import random from wordcloud ...