Resultados de la búsqueda a petición "text-analysis"

1 la respuesta

Big Text Corpus rompe tm_map

Me he estado rompiendo la cabeza por esto en los últimos días. Busqué en todos los archivos SO y probé las soluciones sugeridas, pero parece que no puedo hacer que esto funcione. Tengo conjuntos de documentos txt en carpetas como 2000 06, 1995 ...

3 la respuesta

Bibliotecas de análisis de texto Java

Estoy buscando una solución impulsada por Java para un requisito para analizar oraciones para registrar si una palabra clave se usó positiva o negativamente. Es decir, la palabra clave podría ser 'coles' y la oración: 'Me gustan las coles pero ...

1 la respuesta

Crea dfm paso a paso con quanteda

Quiero analizar un gran corpus de documentos (n = 500,000). estoy usandoquanteda en la expectativa de quesera mas rapido [https://stackoverflow.com/questions/25330753/more-efficient-means-of-creating-a-corpus-and-dtm-with-4m-rows] quetm_map() ...

3 la respuesta

Extraer texto de PDF confuso [cerrado]

Tengo un archivo PDF con valiosa información textual.El problema es que no puedo extraer el texto, todo lo que obtengo es un montón de símbolos confusos. Lo ...

1 la respuesta

Convierta una matriz dispersa (csc_matrix) en un marco de datos de pandas

Quiero convertir esta matriz en un marco de datos de pandas.csc_matrix [http://i.stack.imgur.com/qYkPp.png] losprimeronúmero en el soporte debe ser elíndice, elsegundoser númerocolumnasy elnúmero al finalsiendo eldatos. Quiero hacer esto para ...

6 la respuesta

Datos de capacitación para el análisis de sentimientos [cerrado]

¿Dónde puedo obtener un corpus de documentos que ya han sido clasificados como positivos / negativos para el sentimiento en el dominio corporativo? Quiero un gran corpus de documentos que proporcionen revisiones para compañías, como revisiones ...

4 la respuesta

Cómo extraer frases comunes / significativas de una serie de entradas de texto

Tengo una serie de elementos de texto: HTML sin formato de una base de datos MySQL. Quiero encontrar las frases más comunes en estas entradas (no la frase más común e, idealmente, no imponer la coincidencia palabra por palabra). Mi ejemplo es ...

1 la respuesta

Cómo encontrar frases comunes en un gran cuerpo de texto

1 la respuesta

ValueError: matrices encontradas con números inconsistentes de muestras [6 1786]

Aquí está mi código: from sklearn.svm import SVC from sklearn.grid_search import GridSearchCV from sklearn.cross_validation import KFold from sklearn.feature_extraction.text import TfidfVectorizer from sklearn import datasets import numpy as ...