Nutch Raw Html Saving

Question

Apr 13, 2012, 04:20 PM

Nutch Raw Html Saving

Ich versuche, rohes HTML von gecrawlten Seiten in verschiedenen Dateien zu erhalten, die als URL der Seite bezeichnet werden. Ist es möglich mitNutch Speichern Sie die rohen HTML-Seiten in verschiedenen Dateien, indem Sie den Indexierungsteil ausschließen?