Resultados da pesquisa a pedido "tm"

2 a resposta

Como carregar pacotes em R

2 a resposta

Substituir palavras no corpus de acordo com o quadro de dados do dicionário

1 a resposta

Impossível ver os resultados do texto `RTextTools :: toLower ()` em Document-Term-Matrix

Eu tento criar uma matriz, para isso eu gostaria de permitir o texto. Para isso, uso esta instrução R: matrix = create_matrix(tweets[,1], toLower = TRUE, language="english", removeStopwords=FALSE, removeNumbers=TRUE, stemWords=TRUE)Aqui o código ...

1 a resposta

Erro ao instalar pacotes antigos no R

Estou tentando instalar uma versão 0.6-2 da biblioteca tm. Eu baixei o arquivo tar.gz do diretórioarquivo [https://cran.r-project.org/src/contrib/Archive/tm/]e no RStudio, selecione Ferramentas -> Archive -> Package Archive File ...

1 a resposta

Matriz de termo de documento em R - tokenizer bigram não está funcionando

Estou tentando fazer duas matrizes de termo de documento para um corpus, um com unigramas e outro com bigrams. No entanto, a matriz bigram atualmente é apenas idêntica à matriz unigram, e não sei por que. O ...

1 a resposta

Criando N-Gramas com tm & RWeka - trabalha com VCorpus, mas não com Corpus

Seguindo os vários guias para criarbiGramsusando os pacotes 'tm' e 'RWeka', fiquei frustrado que apenas1-Gramasestavam sendo devolvidos notdm. Através de muitas tentativas e erros, descobri que a função adequada foi alcançada usando ' VCorpus'mas ...

0 a resposta

Comportamento inconsistente com funções de transformação tm_map ao usar vários núcleos

Outro título em potencial para este post pode ser "Quando o processamento paralelo em r, a relação entre o número de núcleos, o tamanho do pedaço de loop e o tamanho do objeto é importante?" Eu tenho um corpus, estou executando algumas ...

2 a resposta

Como calcular a proximidade de palavras com um termo específico em um documento

Estou tentando descobrir uma maneira de calcular proximidades de palavras para um termo específico em um documento, bem como a proximidade média (por palavra). Eu sei que existem perguntas semelhantes sobre o SO, mas nada que me dê a resposta que ...

2 a resposta

Use R para converter arquivos PDF em arquivos de texto para mineração de texto

Eu tenho quase mil artigos de periódicos em pdf em uma pasta. Preciso enviar uma mensagem de texto com os resumos de todos os artigos de toda a pasta. Agora estou fazendo o seguinte: dest <- "~/A1.pdf" # set path to pdftotxt.exe and convert pdf ...

3 a resposta

Dictionary () não é mais suportado no pacote tm. Como emendar código?

Acabei de notar que, depois de atualizar paratm v. 0.5-10 a funçãoDictionary() não é mais suportado. Isso é um erro? Ou foi preterido? Devo usar outra função para criar um dicionário? Já que tenho muitas linhas de código a serem alteradas agora, ...