Utilizando Nutch para rastrear una lista de URL especificada

Tengo un millón de listas de URL para buscar. Utilizo esta lista como semillas de nuez y utilizo la @ básigatea comando de Nutch para buscarlos. Sin embargo, encuentro que Nutch busca automáticamente las URL que no están en la lista. Establezco los parámetros de rastreo como -depth 1 -topN 1000000. Pero no funciona. ¿Alguien sabe como hacer esto

Respuestas a la pregunta(4)

Su respuesta a la pregunta