Resultados da pesquisa a pedido "tm"

Estou tentando criar 3 gramas usando R'squanteda pacote. Estou lutando para encontrar uma maneira de manter os marcadores de começo e fim de frase em n gramas, o<s> e</s> como no código abaixo. Eu pensei que usando okeptFeatures com uma ...

c++datetime format-specifiers strptime

2 a resposta

Como faço para analisar uma string de data e hora que inclui hora fracionária?

Eu tenho uma string de data e hora: 20: 48: 01.469 UTC 31 de março de 2016 Eu gostaria de converter essa representação de string do tempo em umstruct tm usandostrptime, mas minha string de formato não está funcionando. Existe um especificador ...

1 a resposta

remova duplicatas da lista com base na semelhança / semelhança semântica

R + tm: Como desduplicar itens em uma lista, com base na semelhança semântica?v<-c("bank","banks","banking", "ford_suv',"toyota_suv","nissan_suv"). Minha solução esperada seriac("bank", "ford_suv',"toyota_suv","nissan_suv"). Ou seja, bancos, ...

gcc rstudio r

1 a resposta

Erro ao instalar pacotes antigos no R

Estou tentando instalar uma versão 0.6-2 da biblioteca tm. Eu baixei o arquivo tar.gz do diretórioarquivo [https://cran.r-project.org/src/contrib/Archive/tm/]e no RStudio, selecione Ferramentas -> Archive -> Package Archive File ...

tokenize n-gram r rweka

1 a resposta

Matriz de termo de documento em R - tokenizer bigram não está funcionando

Estou tentando fazer duas matrizes de termo de documento para um corpus, um com unigramas e outro com bigrams. No entanto, a matriz bigram atualmente é apenas idêntica à matriz unigram, e não sei por que. O ...

term-document-matrix rweka n-gram r

1 a resposta

Criando N-Gramas com tm & RWeka - trabalha com VCorpus, mas não com Corpus

Seguindo os vários guias para criarbiGramsusando os pacotes 'tm' e 'RWeka', fiquei frustrado que apenas1-Gramasestavam sendo devolvidos notdm. Através de muitas tentativas e erros, descobri que a função adequada foi alcançada usando ' VCorpus'mas ...

text-processing r matrix term-document-matrix

1 a resposta

Impossível ver os resultados do texto `RTextTools :: toLower ()` em Document-Term-Matrix

Eu tento criar uma matriz, para isso eu gostaria de permitir o texto. Para isso, uso esta instrução R: matrix = create_matrix(tweets[,1], toLower = TRUE, language="english", removeStopwords=FALSE, removeNumbers=TRUE, stemWords=TRUE)Aqui o código ...

quanteda r

2 a resposta

Como calcular a proximidade de palavras com um termo específico em um documento

Estou tentando descobrir uma maneira de calcular proximidades de palavras para um termo específico em um documento, bem como a proximidade média (por palavra). Eu sei que existem perguntas semelhantes sobre o SO, mas nada que me dê a resposta que ...

parallel-processing text-mining doparallel r

0 a resposta

Comportamento inconsistente com funções de transformação tm_map ao usar vários núcleos

Outro título em potencial para este post pode ser "Quando o processamento paralelo em r, a relação entre o número de núcleos, o tamanho do pedaço de loop e o tamanho do objeto é importante?" Eu tenho um corpus, estou executando algumas ...

r text-mining

5 a resposta

tm: leia no quadro de dados, mantenha os IDs de texto, construa o DTM e junte-se a outro conjunto de dados

Estou usando o pacote tm. Diz que tenho um quadro de dados de 2 colunas e 500 linhas. A primeira coluna é uma ID gerada aleatoriamente e possui caracteres e números: "txF87uyK" A segunda coluna é o texto real: "O clima de hoje está bom. John ...

Página 5 do 5

1 2 3 45

Resultados da pesquisa a pedido "tm"

Como manter os marcadores de início e fim de frase com quanteda

Como faço para analisar uma string de data e hora que inclui hora fracionária?

remova duplicatas da lista com base na semelhança / semelhança semântica

Tags populares

Erro ao instalar pacotes antigos no R

Matriz de termo de documento em R - tokenizer bigram não está funcionando

Criando N-Gramas com tm & RWeka - trabalha com VCorpus, mas não com Corpus

Impossível ver os resultados do texto `RTextTools :: toLower ()` em Document-Term-Matrix

Como calcular a proximidade de palavras com um termo específico em um documento

Comportamento inconsistente com funções de transformação tm_map ao usar vários núcleos

tm: leia no quadro de dados, mantenha os IDs de texto, construa o DTM e junte-se a outro conjunto de dados

Você é muito ativo! É ótimo!

Resultados da pesquisa a pedido "tm"

Tags populares