Resultados de la búsqueda a petición "tm"

3 la respuesta

Dictionary () ya no es compatible con el paquete tm. ¿Cómo enmendar el código?

Acabo de notar que después de actualizar atm v. 0.5-10 la funciónDictionary() ya no es compatible. ¿Es esto un error? ¿O fue desaprobado? ¿Se supone que debo usar otra función para crear un diccionario? Como tengo muchas líneas de código para ...

1 la respuesta

Matriz de término de documento en R: el tokenizador bigram no funciona

Estoy tratando de hacer 2 matrices de términos de documentos para un corpus, una con unigramas y otra con bigramas. Sin embargo, la matriz bigram es actualmente idéntica a la matriz unigram, y no estoy seguro de por qué. El ...

4 la respuesta

Error de DocumentTermMatrix en argumento Corpus

Tengo el siguiente código: # returns string w/o leading or trailing whitespace trim <- function (x) gsub("^\\s+|\\s+$", "", x) news_corpus <- Corpus(VectorSource(news_raw$text)) # a column of strings. corpus_clean <- tm_map(news_corpus, tolower) ...

0 la respuesta

DocumentTermMatrix falla con un error extraño solo cuando # términos> 3000

Mi código a continuación funciona bien a menos que use crear un DocumentTermMatrix con más de 3000 términos. Esta línea: movie_dict <- findFreqTerms(movie_dtm_train, 8) movie_dtm_hiFq_train <- DocumentTermMatrix(movie_corpus_train, ...

4 la respuesta

R-Project no tiene un método aplicable para 'meta' aplicado a un objeto de la clase "personaje"

Estoy tratando de ejecutar este código (Ubuntu 12.04, R 3.1.1) # Load requisite packages library(tm) library(ggplot2) library(lsa) # Place Enron email snippets into a single vector. text <- c( "To Mr. Ken Lay, I’m writing to urge you to donate ...

3 la respuesta

R Corpus está estropeando mi texto codificado UTF-8

Simplemente estoy tratando de crear un corpus de texto ruso codificado en UTF-8. El problema es que el método Corpus detm El paquete no codifica las cadenas correctamente. Aquí hay un ejemplo reproducible de mi problema: Cargue en el texto ...

2 la respuesta

R tm In mclapply (contenido (x), FUN, ...): todos los núcleos programados encontraron errores en el código de usuario

Cuando ejecuto los siguientes códigos en la penúltima línea, recibí un mensaje de advertencia: En mclapply (contenido (x), FUN, ...): todos los núcleos programados encontraron errores en el código de usuario Cuando corro la línea final, ...

4 la respuesta

stemCompletion no funciona

Estoy usando el paquete tm para el análisis de texto de los datos de reparación, leyendo los datos en el marco de datos, convirtiéndolos en objetos Corpus, apliqué varios métodos para limpiar los datos usando menor, stipWhitespace, elimina ...

1 la respuesta

tm pierde los metadatos al aplicar tm_map

Tengo un problema (pequeño) con la biblioteca tm r. digo que tengo un corpus: # boilerplate bcorp <- c("one","two","three","four","five") myCorpus <- Corpus(VectorSource(bcorp), list(lanuage = "en_US")) tdm <- TermDocumentMatrix(myCorpus) ...

1 la respuesta

Busque programáticamente un símbolo de ticker en R

Tengo un campo de datos que contiene nombres de empresas, como company <- c("Microsoft", "Apple", "Cloudera", "Ford") > company Company 1 Microsoft 2 Apple 3 Cloudera 4 Fordy así. El paquetetm.plugin.webmining le permite consultar datos de ...