Результаты поиска по запросу "screen-scraping"
Очистка страниц, которые, кажется, не имеют URL
Я пытаюсь очистить эти списки и предоставить больше информации об этих списках вакансий на сайте, который принадлежит моему клиенту. Проблема в том, что мне нужно иметь возможность ссылаться на конкретный список вакансий, чтобы соискатель мог ...
как очистить это с помощью простого HTML DOM [закрыто]
Я пытаюсь использовать простой HTML-дом для извлечения элементов из файла, который выглядит следующим образом. Файл имеет несколько таблиц, которые выглядят одинаковоclass=sometable.Каждая таблица имеет несколько<tr class=sometr>.Тогда внутри ...
Исключая нежелательные результаты findAll с использованием BeautifulSoup
Используя BeautifulSoup, я собираюсь очистить текст, связанный с этим HTML-хуком: <p class="review_comment">Итак, используя простой код следующим образом, content = page.read() soup = BeautifulSoup(content) results = ...
Сохранить все файлы изображений с веб-сайта
Я создаю небольшое приложение для себя, где я запускаю скрипт Ruby и сохраняю все изображения из моего блога. Я не могу понять, как сохранить файлы изображений после того, как я их определил. Любая помощь приветствуется. require 'rubygems' ...
Варианты очистки веб-страниц - только версия C ++
Я ищу хорошую библиотеку C ++ для просмотра веб-страниц. Этодолженбыть C / C ++ иничегоиначе, пожалуйста, не направляйте меня кВарианты соскоба HTML [https://stackoverflow.com/questions/2861/options-for-html-scraping]или другие вопросы / ответы ...
Как визуализировать содержимое тега в юникоде в BeautifulSoup?
Это суп со страницы подробностей поста WordPress: content = soup.body.find('div', id=re.compile('post')) title = content.h2.extract() item['title'] = unicode(title.string) item['content'] = u''.join(map(unicode, content.contents))Я хочу опустить ...
Можно ли использовать scrapy для удаления динамического контента с веб-сайтов, использующих AJAX?
Недавно я изучал Python и погружаюсь в создание веб-скребка. Ничего особенного; его единственная цель - получить данные с веб-сайта для ставок и поместить их в Excel. Большинство проблем решаемы, и у меня есть хороший маленький беспорядок ...
Соскребание экрана с веб-страницы с большим количеством Javascript [закрыто]
Меня попросили написать приложение, которое выводит информацию с веб-страницы интрасети и представляет определенную информацию в удобном для просмотра формате. Веб-страница представляет собой настоящий беспорядок и требует, чтобы пользователь ...
Невозможно получить данные о расписании со своего школьного сайта. Войти через cURL не получится
Редактировать:Почему минус один? Я пытаюсь сделать следующее: Я пытаюсь войти на свой школьный сайт, используя cURL, и взять расписание, чтобы использовать его для своего ИИ.Поэтому мне нужно войти в систему, используя свой пароль и номер, но ...
JSON Scraping - конвертируйте военное время в стандартное время с помощью Javascript
Я очищаю данные JSON от URL. Время военное, и мне было интересно, есть ли способ, когда я получаю данные на стороне клиента, чтобы преобразовать его в стандартное время. Вот JSON: [ { SaturdayClose: "21:00", SaturdayOpen: "10:00", SundayClose: ...