Результаты поиска по запросу "screen-scraping"

1 ответ

Очистка страниц, которые, кажется, не имеют URL

Я пытаюсь очистить эти списки и предоставить больше информации об этих списках вакансий на сайте, который принадлежит моему клиенту. Проблема в том, что мне нужно иметь возможность ссылаться на конкретный список вакансий, чтобы соискатель мог ...

1 ответ

как очистить это с помощью простого HTML DOM [закрыто]

Я пытаюсь использовать простой HTML-дом для извлечения элементов из файла, который выглядит следующим образом. Файл имеет несколько таблиц, которые выглядят одинаковоclass=sometable.Каждая таблица имеет несколько<tr class=sometr>.Тогда внутри ...

1 ответ

Исключая нежелательные результаты findAll с использованием BeautifulSoup

Используя BeautifulSoup, я собираюсь очистить текст, связанный с этим HTML-хуком: <p class="review_comment">Итак, используя простой код следующим образом, content = page.read() soup = BeautifulSoup(content) results = ...

ТОП публикаций

4 ответа

Сохранить все файлы изображений с веб-сайта

Я создаю небольшое приложение для себя, где я запускаю скрипт Ruby и сохраняю все изображения из моего блога. Я не могу понять, как сохранить файлы изображений после того, как я их определил. Любая помощь приветствуется. require 'rubygems' ...

4 ответа

Варианты очистки веб-страниц - только версия C ++

Я ищу хорошую библиотеку C ++ для просмотра веб-страниц. Этодолженбыть C / C ++ иничегоиначе, пожалуйста, не направляйте меня кВарианты соскоба HTML [https://stackoverflow.com/questions/2861/options-for-html-scraping]или другие вопросы / ответы ...

1 ответ

Как визуализировать содержимое тега в юникоде в BeautifulSoup?

Это суп со страницы подробностей поста WordPress: content = soup.body.find('div', id=re.compile('post')) title = content.h2.extract() item['title'] = unicode(title.string) item['content'] = u''.join(map(unicode, content.contents))Я хочу опустить ...

8 ответов

Можно ли использовать scrapy для удаления динамического контента с веб-сайтов, использующих AJAX?

Недавно я изучал Python и погружаюсь в создание веб-скребка. Ничего особенного; его единственная цель - получить данные с веб-сайта для ставок и поместить их в Excel. Большинство проблем решаемы, и у меня есть хороший маленький беспорядок ...

7 ответов

Соскребание экрана с веб-страницы с большим количеством Javascript [закрыто]

Меня попросили написать приложение, которое выводит информацию с веб-страницы интрасети и представляет определенную информацию в удобном для просмотра формате. Веб-страница представляет собой настоящий беспорядок и требует, чтобы пользователь ...

3 ответа

Невозможно получить данные о расписании со своего школьного сайта. Войти через cURL не получится

Редактировать:Почему минус один? Я пытаюсь сделать следующее: Я пытаюсь войти на свой школьный сайт, используя cURL, и взять расписание, чтобы использовать его для своего ИИ.Поэтому мне нужно войти в систему, используя свой пароль и номер, но ...

5 ответов

JSON Scraping - конвертируйте военное время в стандартное время с помощью Javascript

Я очищаю данные JSON от URL. Время военное, и мне было интересно, есть ли способ, когда я получаю данные на стороне клиента, чтобы преобразовать его в стандартное время. Вот JSON: [ { SaturdayClose: "21:00", SaturdayOpen: "10:00", SundayClose: ...