Resultados de la búsqueda a petición "tm"
Dictionary () ya no es compatible con el paquete tm. ¿Cómo enmendar el código?
Acabo de notar que después de actualizar atm v. 0.5-10 la funciónDictionary() ya no es compatible. ¿Es esto un error? ¿O fue desaprobado? ¿Se supone que debo usar otra función para crear un diccionario? Como tengo muchas líneas de código para ...
Matriz de término de documento en R: el tokenizador bigram no funciona
Estoy tratando de hacer 2 matrices de términos de documentos para un corpus, una con unigramas y otra con bigramas. Sin embargo, la matriz bigram es actualmente idéntica a la matriz unigram, y no estoy seguro de por qué. El ...
Error de DocumentTermMatrix en argumento Corpus
Tengo el siguiente código: # returns string w/o leading or trailing whitespace trim <- function (x) gsub("^\\s+|\\s+$", "", x) news_corpus <- Corpus(VectorSource(news_raw$text)) # a column of strings. corpus_clean <- tm_map(news_corpus, tolower) ...
DocumentTermMatrix falla con un error extraño solo cuando # términos> 3000
Mi código a continuación funciona bien a menos que use crear un DocumentTermMatrix con más de 3000 términos. Esta línea: movie_dict <- findFreqTerms(movie_dtm_train, 8) movie_dtm_hiFq_train <- DocumentTermMatrix(movie_corpus_train, ...
R-Project no tiene un método aplicable para 'meta' aplicado a un objeto de la clase "personaje"
Estoy tratando de ejecutar este código (Ubuntu 12.04, R 3.1.1) # Load requisite packages library(tm) library(ggplot2) library(lsa) # Place Enron email snippets into a single vector. text <- c( "To Mr. Ken Lay, I’m writing to urge you to donate ...
R Corpus está estropeando mi texto codificado UTF-8
Simplemente estoy tratando de crear un corpus de texto ruso codificado en UTF-8. El problema es que el método Corpus detm El paquete no codifica las cadenas correctamente. Aquí hay un ejemplo reproducible de mi problema: Cargue en el texto ...
R tm In mclapply (contenido (x), FUN, ...): todos los núcleos programados encontraron errores en el código de usuario
Cuando ejecuto los siguientes códigos en la penúltima línea, recibí un mensaje de advertencia: En mclapply (contenido (x), FUN, ...): todos los núcleos programados encontraron errores en el código de usuario Cuando corro la línea final, ...
stemCompletion no funciona
Estoy usando el paquete tm para el análisis de texto de los datos de reparación, leyendo los datos en el marco de datos, convirtiéndolos en objetos Corpus, apliqué varios métodos para limpiar los datos usando menor, stipWhitespace, elimina ...
tm pierde los metadatos al aplicar tm_map
Tengo un problema (pequeño) con la biblioteca tm r. digo que tengo un corpus: # boilerplate bcorp <- c("one","two","three","four","five") myCorpus <- Corpus(VectorSource(bcorp), list(lanuage = "en_US")) tdm <- TermDocumentMatrix(myCorpus) ...
Busque programáticamente un símbolo de ticker en R
Tengo un campo de datos que contiene nombres de empresas, como company <- c("Microsoft", "Apple", "Cloudera", "Ford") > company Company 1 Microsoft 2 Apple 3 Cloudera 4 Fordy así. El paquetetm.plugin.webmining le permite consultar datos de ...