Возможно, это поможет некоторым людям, которые хотели автоматизировать сохранение страниц. И если кто-то может улучшить это, возможно, вы могли бы сказать, как в комментарии или другого ответа. Особенно, если вы знаете, почему диалоговое окно «Сохранить как» не закрывается надежно, и знаете, как это исправить.

ужно заархивировать несколько сотен веб-страниц в стиле, который браузеры называют «Сохранить как, завершить», то есть они сохраняют HTML-файл для самой страницы вместе с папкой, полной других файлов, необходимых для правильного отображения страницы, таких как CSS, JS и файлы изображений. Это позволяет просматривать страницы в автономном режиме так же, как при просмотре в Интернете.

Вот методы, которые я пробовал, и проблемы с каждым из них:

Ручной процесс в Firefox:

На ссылку для следующей страницы, щелкните правой кнопкой мыши. Введите «A» для «Сохранить местоположение ссылки», чтобы скопировать целевой URL в буфер обмена.Нажмите на ссылку, чтобы перейти на страницу.Введите «Alt-F-A» для «Сохранить страницу как». Если еще не выбран, установите «Сохранить как тип» в «Веб-страница, завершено».Если это еще не сделано, поместите курсор в поле «Имя файла». Введите «Ctrl-Insert», чтобы вставить буфер обмена, который содержит URL-адрес текущей страницы.Переместите курсор в конец URL-адреса, затем переместите его назад, пока он не достигнет последнего символа «/». Выберите там слева, чтобы выбрать часть пути URL.Нажмите «Удалить», чтобы удалить путь из URL, оставив только имя файла.Нажмите «Enter» на клавиатуре или «Ok» в диалоговом окне.Страница теперь сохранена. Повторите процесс, нажав на ссылку для следующей страницы. (Предполагается, что на каждой странице есть ссылка «Далее», что верно для страниц, которые я архивирую. Если бы это было не так, то был бы дополнительный шаг, чтобы вернуться на страницу со списком всех ссылок и щелкнуть следующий оттуда.)

Это довольно утомительно делать снова и снова. Это процесс, который я хочу автоматизировать.

iMacros, Этот тип повторяющихся задач - именно то, для чего нужны макросы. Ранее я использовал iMacros для аналогичных задач в веб-браузере, но долгое время не использовал его. Я переустановил его, выяснил, как его использовать снова, и написал макрос, состоящий из одной или двух строк, чтобы сохранить текущую страницу с именем ее URL-адреса. Затем, когда я попытался запустить его, iMacros сообщил мне, чтоSaveAs Команда не доступна в бесплатной версии, и мне нужно перейти на версию за 100 долларов (с 30-дневной бесплатной пробной версией), чтобы получить эту возможность. Меня не впечатлило то, что я увидел в текущей версии программного обеспечения, и я обнаружил, что оно неуклюже и плохо документировано. Поэтому я предпочел искать другое решение.

Wget, Это очень круто.Википедия описывает его как «компьютерную программу, которая извлекает контент с веб-серверов». Это было новым для меня, и потребовалось время, чтобы понять. В основном это приложение для Unix, оно также доступно для Windows и представляет собой небольшой исполняемый файл, который не требует установки. Я выучил его достаточно, чтобы загрузить несколько тестовых страниц, но когда я зашел на страницы, которые мне нужно заархивировать, это не сработало на них. Я отправилэлектронная почта в список рассылки Wget о проблеме и жду, чтобы увидеть, смогу ли я понять это с некоторой помощью. (Связанное электронное письмо имеет командную строку Wget, которую я использовал, включая URL-адрес страницы, которую я хочу заархивировать, с вложенными файлами изображений того, как страница выглядит в Интернете и после сохранения Wget.)

Изменить: более недели спустя, в списке рассылки Wget не было ответа.

Селен, Хотя этоне говорит, что это для построения макросов, но "тестовые случаи".Похоже, что макросистема гораздо более высокого качества, чем iMacros. Я попробовал это. Но я обнаружил, что он не записывает все, что мне нужно сделать в процедуре подРучной процесс в Firefox выше. Например, когда я щелкнул правой кнопкой мыши ссылку и набрал «A», чтобы сохранить связанный URL-адрес, Selenium не добавил ничего в алгоритм, который записывал. После перехода по ссылке, когда я сохранил страницу, Selenium снова ничего не сделал. Так что, хотя оно выглядит как качественное программное обеспечение, оно, похоже, не обладает необходимыми мне возможностями, если только я не понимаю что-то неправильно.

Так что я в тупике. Я не собираюсь делать этот ручной процесс несколько сотен раз. Поэтому мне нужно найти способ автоматизировать это. Как я могу это сделать?

Ответы на вопрос(2)

Ваш ответ на вопрос