Resultados de la búsqueda a petición "tm"

2 la respuesta

Eliminar palabras demasiado comunes (aparecen en más del 80% de los documentos) en R

Estoy trabajando con el paquete 'tm' para crear un corpus. He realizado la mayoría de los pasos de preprocesamiento. Lo que resta es eliminar palabras demasiado comunes (términos que aparecen en más del 80% de los documentos). ¿Puede alguien ...

1 la respuesta

Big Text Corpus rompe tm_map

Me he estado rompiendo la cabeza por esto en los últimos días. Busqué en todos los archivos SO y probé las soluciones sugeridas, pero parece que no puedo hacer que esto funcione. Tengo conjuntos de documentos txt en carpetas como 2000 06, 1995 ...

2 la respuesta

Cómo seleccionar solo un subconjunto de términos de corpus para la creación de TermDocumentMatrix en tm

Tengo un gran corpus, y estoy interesado en la aparición de un puñado de términos que conozco por adelantado. ¿Hay alguna manera de crear una matriz de documentos de término a partir del corpus usando eltm paquete, donde solo se deben usar e ...

7 la respuesta

Error de FUN después de ejecutar 'tolower' al hacer wordcloud de Twitter

Intentando crear wordcloud a partir de datos de twitter, pero aparece el siguiente error: Error in FUN(X[[72L]], ...) : invalid input '������������❤������������ "@xxx:bla, bla, bla... http://t.co/56Fb78aTSC"' in 'utf8towcs'Este error ...

3 la respuesta

¿Cómo funciona removeSparseTerms en R?

Estoy usando el método removeSparseTerms en R y requería que se ingresara un valor umbral. También leí que cuanto mayor sea el valor, mayor será el número de términos retenidos en la matriz devuelta. ¿Cómo funciona este método y cuál es la ...

4 la respuesta

Cómo determinar qué versión anterior del paquete R es compatible con mi versión R

Estoy tratando de instalar el paquete "tm" pero aparece un error que dice que "tm" no está disponible para mi versión R package ‘tm’ is not available (for R version 3.0.2)Pero luego vi que alguien sugirió que descargue la versión archivada ...

2 la respuesta

minería de texto con paquete tm en R, elimine palabras que comiencen desde [http] o cualquier otra palabra específica

Soy nuevo en R y minería de texto. Había creado una nube de palabras en el feed de Twitter relacionado con algún término. El problema al que me enfrento es que en el wordcloud muestra http: ... o htt ... ¿Cómo trato este problema? Intenté usar ...

5 la respuesta

tm: lea en el marco de datos, mantenga identificaciones de texto, construya DTM y únase a otro conjunto de datos

Estoy usando el paquete tm. Digo que tengo un marco de datos de 2 columnas, 500 filas. La primera columna es ID que se genera aleatoriamente y tiene tanto el carácter como el número: "txF87uyK" La segunda columna es texto real: "El clima de hoy ...