Resultados de la búsqueda a petición "text-mining"
Comportamiento inconsistente con las funciones de transformación tm_map cuando se usan múltiples núcleos
Otro título potencial para esta publicación podría ser "Cuando se procesa en paralelo en r, ¿importa la relación entre el número de núcleos, el tamaño del fragmento de bucle y el tamaño del objeto?" Tengo un corpus en el que estoy ejecutando ...
Utilice el PDF scikit-learn con gensim LDA
He usado varias versiones de TFIDF en scikit para modelar algunos datos de texto.
¿Cálculo de ganancia de información para un archivo de texto?
Estoy trabajando en eso"Categorización de texto usando ganancia de información, PCA y algoritmo genético" Pero después de realizarPreprocesamiento(...
minería de texto árabe usando R [cerrado]
Soy un usuario nuevo y solo quiero obtener ayuda con mi trabajo en R. Estoy haciendo minería de texto en árabe y me encantaría tener ayuda para que alguien tenga experiencia en estos campos. Hasta ahora me sentí normalizar el texto árabe e ...
Big Text Corpus rompe tm_map
Me he estado rompiendo la cabeza por esto en los últimos días. Busqué en todos los archivos SO y probé las soluciones sugeridas, pero parece que no puedo hacer que esto funcione. Tengo conjuntos de documentos txt en carpetas como 2000 06, 1995 ...
Guarde y reutilice TfidfVectorizer en scikit learn
Estoy usando TfidfVectorizer en scikit learn para crear una matriz a partir de datos de texto. Ahora necesito guardar este objeto para reutilizarlo más tarde. Intenté usar pickle, pero me dio el siguiente error. loc=open('vectorizer.obj','w') ...