Resultados de la búsqueda a petición "term-document-matrix"
Medios más eficientes de crear un corpus y DTM con 4M filas
Mi archivo tiene más de 4 millones de filas y necesito una forma más eficiente de convertir mis datos en un corpus y una matriz de términos de documentos para poder pasarlos a un clasificador bayesiano. Considere el siguiente ...
Cómo seleccionar solo un subconjunto de términos de corpus para la creación de TermDocumentMatrix en tm
Tengo un gran corpus, y estoy interesado en la aparición de un puñado de términos que conozco por adelantado. ¿Hay alguna manera de crear una matriz de documentos de término a partir del corpus usando eltm paquete, donde solo se deben usar e ...
Crear N-Grams con tm y RWeka: funciona con VCorpus pero no con Corpus
Seguir las muchas guías para crearbiGramsusando los paquetes 'tm' y 'RWeka', me frustraba que solo1-gramosestaban siendo devueltos en eltdm. A través de muchas pruebas y errores descubrí que la función adecuada se logró usando 'VCorpus'pero no ...
Big Text Corpus rompe tm_map
Me he estado rompiendo la cabeza por esto en los últimos días. Busqué en todos los archivos SO y probé las soluciones sugeridas, pero parece que no puedo hacer que esto funcione. Tengo conjuntos de documentos txt en carpetas como 2000 06, 1995 ...
Crea dfm paso a paso con quanteda
Quiero analizar un gran corpus de documentos (n = 500,000). estoy usandoquanteda en la expectativa de quesera mas rapido [https://stackoverflow.com/questions/25330753/more-efficient-means-of-creating-a-corpus-and-dtm-with-4m-rows] quetm_map() ...
Página 1 de 2