Resultados de la búsqueda a petición "term-document-matrix"

4 la respuesta

Error al convertir el texto a minúsculas con tm_map (…, tolower)

Intenté usar el

4 la respuesta

Medios más eficientes de crear un corpus y DTM con 4M filas

Mi archivo tiene más de 4 millones de filas y necesito una forma más eficiente de convertir mis datos en un corpus y una matriz de términos de documentos para poder pasarlos a un clasificador bayesiano. Considere el siguiente ...

2 la respuesta

Cómo seleccionar solo un subconjunto de términos de corpus para la creación de TermDocumentMatrix en tm

Tengo un gran corpus, y estoy interesado en la aparición de un puñado de términos que conozco por adelantado. ¿Hay alguna manera de crear una matriz de documentos de término a partir del corpus usando eltm paquete, donde solo se deben usar e ...

1 la respuesta

findAssocs para términos múltiples en R

En R usé el

6 la respuesta

lista de frecuencias de palabras usando R

1 la respuesta

R tm package crea matriz de términos más frecuentes

tengo un

1 la respuesta

Crear N-Grams con tm y RWeka: funciona con VCorpus pero no con Corpus

Seguir las muchas guías para crearbiGramsusando los paquetes 'tm' y 'RWeka', me frustraba que solo1-gramosestaban siendo devueltos en eltdm. A través de muchas pruebas y errores descubrí que la función adecuada se logró usando 'VCorpus'pero no ...

2 la respuesta

¿Cómo construir un Term-Document-Matrix a partir de un conjunto de textos y un conjunto específico de términos (etiquetas)?

1 la respuesta

Big Text Corpus rompe tm_map

Me he estado rompiendo la cabeza por esto en los últimos días. Busqué en todos los archivos SO y probé las soluciones sugeridas, pero parece que no puedo hacer que esto funcione. Tengo conjuntos de documentos txt en carpetas como 2000 06, 1995 ...

1 la respuesta

Crea dfm paso a paso con quanteda

Quiero analizar un gran corpus de documentos (n = 500,000). estoy usandoquanteda en la expectativa de quesera mas rapido [https://stackoverflow.com/questions/25330753/more-efficient-means-of-creating-a-corpus-and-dtm-with-4m-rows] quetm_map() ...