Resultados de la búsqueda a petición "nutch"

4 la respuesta

Cómo obtener el contenido html de nutch

¿Hay alguna forma de obtener el contenido html de cada página web en nutch mientras rastrea la página web?

2 la respuesta

Volver a rastrear sitios web rápidamente

Estoy desarrollando un sistema que tiene que rastrear el contenido de algunos portales y verificar los cambios todas las noches (por ejemplo, descargar e indexar nuevos sitios que se han agregado durante el día). El contenido de estos portales se ...

7 la respuesta

Algoritmo Web Cralwer: ¿profundidad?

Estoy trabajando en un rastreador y necesito entender exactamente qué se entiende por "profundidad de enlace". Tome nutch por ejemplo: http://wiki.apache.org/nutch/NutchTutorial [http://wiki.apache.org/nutch/NutchTutorial] profundidad indica la ...

1 la respuesta

Nutch versus Solr

Actualmente estoy recopilando información sobre dónde debería usar Nutch con Solr (dominio - búsqueda web vertical). ¿Podrías sugerirme?

3 la respuesta

Usando rastreador Nutch con Solr