Использование Nutch для сканирования указанного списка URL

Question

Feb 06, 2012, 01:32 AM

Использование Nutch для сканирования указанного списка URL

У меня есть один миллион URL-адресов для получения. Я использую этот список как семена орешка и использую основныеползать команда Nutch, чтобы получить их. Тем не менее, я считаю, что Nutch автоматически выбирает URL, которых нет в списке. Я устанавливаю параметры сканирования как -depth 1 -topN 1000000. Но это не работает. Кто-нибудь знает как это сделать?

Использование Nutch для сканирования указанного списка URL

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Использование Nutch для сканирования указанного списка URL

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы