Jak zapisać oryginalny plik HTML z Apache Nutch

Jestem nowy w wyszukiwarkach i robotach indeksujących. Teraz chcę przechowywać wszystkie oryginalne strony w określonej witrynie internetowej jako pliki html, ale z Apache Nutch mogę pobrać tylko binarne pliki baz danych. Jak uzyskać oryginalne pliki HTML z Nutch?

Czy Nutch to wspiera? Jeśli nie, jakie inne narzędzia mogę wykorzystać do osiągnięcia mojego celu (narzędzia, które obsługują indeksowanie rozproszone, są lepsze).

questionAnswers(5)

yourAnswerToTheQuestion