Usando o Nutch para rastrear uma lista de URLs especificadas

Tenho um milhão de listas de URLs para buscar. Eu uso esta lista como sementes de noz e uso o básicorasteja comando de Nutch para buscá-los. No entanto, acho que o Nutch busca automaticamente URLs que não estão na lista. Eu defino os parâmetros de rastreamento como -thp 1 -topN 1000000. Mas isso não funciona. Alguém sabe como fazer isso