Эквивалент wget в Python для загрузки сайта и ресурсов
То же самое спросили 2,5 года назад вЗагрузка веб-страницы и всех ее файлов ресурсов в Python но не приводит к ответу, и «пожалуйста, посмотрите связанную тему» на самом деле не спрашивает то же самое.
Я хочу скачать все на странице, чтобы можно было просматривать только из файлов.
Команда
wget - page-реквизиты --domains = DOMAIN --no-parent --html-extension --convert-links --restrict-file-names = windows
делает именно то, что мне нужно. Однако мы хотим иметь возможность связать его с другими вещами, которые должны быть переносимыми, поэтому требуется, чтобы это было в Python.
Я смотрел на Beautiful Soup, scrapy, различных пауков, размещенных повсюду, но все они, похоже, имеют дело с получением данных / ссылок умным, но особым образом. Использование их для выполнения того, что я хочу, похоже, потребует много работы, чтобы найти все ресурсы, когда я уверен, что должен быть легкий путь.
большое спасибо