Результаты поиска по запросу "screen-scraping"

4 ответа

Загрузка PhantomJS с использованием ссылки на JavaScript

Я пытаюсь очистить веб-сайт ...

5 ответов

очистить HTML, сгенерированный JavaScript с Python

Мне нужно очистить сайт с помощью Python. Я получаю исходный html-код с помощью модуля urlib, но мне нужно также очистить некоторый html-код, сгенерированный функцией javascript (который включен в html-источник). Что делает эта функция «на» ...

7 ответов

WebBrowsing в C # - библиотеки, инструменты и т. Д. - Что-нибудь вроде Mechanize в Perl? [закрыто]

Ищете что-то похожее на Mechanize для .NET ... Если вы не знаете, что такое Mechanize .. http://search.cpan.org/dist/WWW-Mechanize/ [http://search.cpan.org/dist/WWW-Mechanize/] Я буду вести список предложений здесь. Все для просмотра / ...

ТОП публикаций

2 ответа

Как извлечь текст из тега шрифта с помощью Beautifulsoup

Я делаю свою первую программу с Beautifulsoup, и мой HTML-файл имеет фрагмент кода, как это ...... ...... ...... <font face="verdana" size="3">5 n i D 1 C</font> ...... ......Я хочу извлечь5 n i D 1 C изнутри<font> тег. я делаю ele=soup('font', ...

1 ответ

Выскабливание флеш сайтов

Я готов создать сценарий, который берет информацию с веб-сайта, который делается во флэш-памяти. Я собирался начать кодировать приложение, делая что-то вроде: перемещение мыши в положение x, y.сделать щелчок мыши.подождите х ...

2 ответа

Может ли quickminer извлекать xpath из списка URL-адресов вместо того, чтобы сначала сохранять HTML-страницы?

Я недавно открыл RapidMiner, и я очень рад его возможностям. Однако я все еще не уверен, может ли программа помочь мне с моими конкретными потребностями. Я хочу, чтобы программа очищала совпадения xpath от списка URL-адресов, созданного с помощью ...

1 ответ

Выберите все <p> из дочерних узлов, используя HTMLAgilityPack

У меня есть следующий код, который я использую, чтобы получить HTML-страницу. Сделайте URL-адреса абсолютными, а затем сделайте ссылки релевантными и откройте их в новом окне / вкладке. Моя проблема заключается в добавлении ...

3 ответа

Python WWW макрос

мне нужно что-то вроде iMacros для Python. Было бы здорово иметь что-то подобное: browse_to('www.google.com') type_in_input('search', 'query') click_button('search') list = get_all('<p>')Вы знаете что-то подобное? Заранее спасибо, Этам.

3 ответа

Невозможно вызвать Firefox из селена в Python на машине AWS

Я пытаюсь использовать селен из Python, чтобы очистить некоторые динамические страницы с помощью JavaScript. Тем не менее, я не могу вызвать firefox после того, как я следовал инструкциям selenium на странице ...

3 ответа

Просмотр сгенерированного источника (после AJAX / JavaScript) в C #

Есть ли способ просмотреть сгенерированный источник веб-страницы (код после всех вызовов AJAX и манипуляций с JavaScript DOM) из приложения C # без открытия браузера из кода? Просмотр начальной страницы с ...