Resultados de la búsqueda a petición "information-retrieval"

3 la respuesta

¿Cómo calcular TF * IDF para un único documento nuevo que se clasificará?

Estoy usando vectores de término de documento para representar una colección de documentos. yo sueloTF * IDF [http://en.wikipedia.org/wiki/Tf%E2%80%93idf]para calcular el peso del término para cada vector de documento. Entonces podría usar esta ...

1 la respuesta

Error de análisis de búsqueda de función de búsqueda de puntaje elástico

Estoy tratando de ejecutar una consulta de puntaje de función directa en elasticsearch como: { "function_score": { "query": { "term": { "timestamp": { "value": 1396361509, "boost": 0.05 } } }, "script_score": { "script": "abs(1396361509 ...

6 la respuesta

Descarga de texto de Wikipedia

Estoy buscando descargar el texto completo de Wikipedia para mi proyecto universitario. ¿Tengo que escribir mi propia araña para descargar esto o hay un conjunto de datos público de Wikipedia disponible en línea? Para darle una visión general de ...

1 la respuesta

Cálculo de tf-idf entre documentos usando python 2.7

Tengo un escenario en el que recuperé información / datos sin procesar de Internet y los coloqué en sus respectivos archivos json o .txt. A partir de ahí, me gustaría calcular las frecuencias de cada término en cada documento y su similitud de ...

1 la respuesta

¿Cómo raspar web las noticias diarias una vez al día usando Python?

Estoy tratando de crear una aplicación para la cual necesito noticias diarias de varios sitios web. Una forma de hacerlo es mediante el uso deBeautifulSoup [http://www.crummy.com/software/BeautifulSoup/bs4/doc/]biblioteca de Python. Sin embargo, ...

2 la respuesta

Escribir un programa para raspar foros

Necesito escribir un programa para raspar foros. ¿Debo escribir el programa en Python usando el framework Scrapy o debo usar Php cURL? ¿También hay un Php equivalente a Scrapy? Gracias

2 la respuesta

¿Cómo puedo recuperar mi historial de búsqueda de Google?

En la interfaz del Historial web de Google puedo ver todas las consultas de búsqueda que he utilizado a lo largo de los años, y las páginas que visité para una consulta en particular. ¿Hay alguna manera de recuperar este historial usando un ...

2 la respuesta

Transformar texto en vector

Tengo un diccionario con palabras y la frecuencia de cada palabra. {'cxampphtdocsemployeesphp': 1, 'emptiness': 1, 'encodingundefinedconversionerror': 1, 'msbuildexe': 2, 'e5': 1, 'lnk4049': 1, 'specifierqualifierlist': 2, .... }Ahora quiero ...

5 la respuesta

¿Hay un motor de búsqueda que dará una respuesta directa? [cerrado

Me he estado preguntando acerca de esto por un tiempo y no puedo ver por qué Google aún no lo ha intentado, o tal vez lo hayan hecho y simplemente no lo sé. ¿Existe un motor de búsqueda en el que pueda escribir una pregunta que le dará una ...

4 la respuesta

Python o Java para procesamiento de texto (minería de texto, recuperación de información, procesamiento de lenguaje natural) [cerrado]

Pronto comenzaré un nuevo proyecto en el que haré muchas tareas de procesamiento de texto, como búsqueda, categorización / clasificación, agrupamiento, et Habrá una gran cantidad de documentos que deben procesarse; probablemente millones de ...