Resultados de la búsqueda a petición "text-mining"

2 la respuesta

¿Los archivos PDF de texto-mina con Python?

¿Hay un paquete / biblioteca para python que me permita abrir un PDF y buscar en el texto ciertas palabras?

1 la respuesta

findAssocs para términos múltiples en R

En R usé el

6 la respuesta

lista de frecuencias de palabras usando R

1 la respuesta

Utilice el PDF scikit-learn con gensim LDA

He usado varias versiones de TFIDF en scikit para modelar algunos datos de texto.

4 la respuesta

Encontrar ngrams en R y comparar ngrams a través de cuerpos

Estoy empezando con el paquete tm en R, así que, por favor, tengan paciencia conmigo y pido disculpas por la gran pared de texto. He creado un corpus bastant...

1 la respuesta

¿Cálculo de ganancia de información para un archivo de texto?

Estoy trabajando en eso"Categorización de texto usando ganancia de información, PCA y algoritmo genético" Pero después de realizarPreprocesamiento(...

2 la respuesta

Usa R para convertir archivos PDF en archivos de texto para minería de texto

Tengo cerca de mil artículos de revistas pdf en una carpeta. Necesito enviar un mensaje de texto en los resúmenes de todos los artículos de toda la carpeta. ...

3 la respuesta

Suma de filas para matriz de documentos a largo plazo / simple_triplet_matrix ?? {paquete tm}

Entonces tengo una matriz de documentos a término muy grande: > class(ph.DTM) [1] "TermDocumentMatrix" "simple_triplet_matrix" > ph.DTM A term-document matrix (109996 terms, 262811 documents) Non-/sparse entries: 3705693/28904453063 Sparsity : ...

3 la respuesta

¿Cómo calcular TF * IDF para un único documento nuevo que se clasificará?

Estoy usando vectores de término de documento para representar una colección de documentos. yo sueloTF * IDF [http://en.wikipedia.org/wiki/Tf%E2%80%93idf]para calcular el peso del término para cada vector de documento. Entonces podría usar esta ...

4 la respuesta

R-Project no tiene un método aplicable para 'meta' aplicado a un objeto de la clase "personaje"

Estoy tratando de ejecutar este código (Ubuntu 12.04, R 3.1.1) # Load requisite packages library(tm) library(ggplot2) library(lsa) # Place Enron email snippets into a single vector. text <- c( "To Mr. Ken Lay, I’m writing to urge you to donate ...