Resultados de la búsqueda a petición "text-mining"

0 la respuesta

Comportamiento inconsistente con las funciones de transformación tm_map cuando se usan múltiples núcleos

Otro título potencial para esta publicación podría ser "Cuando se procesa en paralelo en r, ¿importa la relación entre el número de núcleos, el tamaño del fragmento de bucle y el tamaño del objeto?" Tengo un corpus en el que estoy ejecutando ...

1 la respuesta

R tm package crea matriz de términos más frecuentes

tengo un

1 la respuesta

Haga el marco de datos de los términos más frecuentes de la N para múltiples corpora utilizando el paquete tm en R

Yo tengo varias

1 la respuesta

R Minería de texto: ¿cómo cambiar los textos en la columna del marco de datos R en varias columnas con frecuencias de bigrama?

1 la respuesta

findAssocs para términos múltiples en R

En R usé el

1 la respuesta

Utilice el PDF scikit-learn con gensim LDA

He usado varias versiones de TFIDF en scikit para modelar algunos datos de texto.

1 la respuesta

¿Cálculo de ganancia de información para un archivo de texto?

Estoy trabajando en eso"Categorización de texto usando ganancia de información, PCA y algoritmo genético" Pero después de realizarPreprocesamiento(...

1 la respuesta

minería de texto árabe usando R [cerrado]

Soy un usuario nuevo y solo quiero obtener ayuda con mi trabajo en R. Estoy haciendo minería de texto en árabe y me encantaría tener ayuda para que alguien tenga experiencia en estos campos. Hasta ahora me sentí normalizar el texto árabe e ...

1 la respuesta

Big Text Corpus rompe tm_map

Me he estado rompiendo la cabeza por esto en los últimos días. Busqué en todos los archivos SO y probé las soluciones sugeridas, pero parece que no puedo hacer que esto funcione. Tengo conjuntos de documentos txt en carpetas como 2000 06, 1995 ...

1 la respuesta

Guarde y reutilice TfidfVectorizer en scikit learn

Estoy usando TfidfVectorizer en scikit learn para crear una matriz a partir de datos de texto. Ahora necesito guardar este objeto para reutilizarlo más tarde. Intenté usar pickle, pero me dio el siguiente error. loc=open('vectorizer.obj','w') ...