Результаты поиска по запросу "beautifulsoup"

3 ответа

Получение значения атрибута с помощью BeautifulSoup

Я пишу скрипт на Python, который будет извлекать местоположения скрипта после анализа с веб-страницы. Допустим, есть два сценария: <script type="text/javascript" src="http://example.com/something.js"></script>а также <script>some JS</script>Я ...

2 ответа

BeautifulSoup HTML разбора таблицы

Я пытаюсь проанализировать информацию (HTML-таблицы) с этого сайта: http://www.511virginia.org/RoadConditions.aspx?j=All&r=1 [http://www.511virginia.org/RoadConditions.aspx?j=All&r=1] В настоящее время я использую BeautifulSoup и код у меня ...

1 ответ

Выход:

аюсь получить содержимое конкретного тега, который имеет атрибут, но не имеет значений. Как я могу получить это например cont = '<nav></nav> <nav breadcrumbs> <a href="">aa</a></nav> <nav></nav>'Из приведенного выше я хочу извлечь<nav ...

ТОП публикаций

5 ответов

Спасибо всем, я в конечном итоге использовал решение Уильяма. На случай, если у кого-нибудь появятся будущие проекты, вот мой полный код для сбора нескольких URL-адресов для подсчета подписчиков:

у проанализировать количество подписчиков на сайте с BeautifulSoup. Это то, что я до сих пор: username_extract = 'lazada_my' url = 'https://www.instagram.com/'+ username_extract r = requests.get(url) soup = BeautifulSoup(r.content,'lxml') f = ...

9 ответов

Это сработало для меня:

я возникают проблемы при разборе html-элементов с атрибутом "class" с помощью Beautifulsoup. Код выглядит так soup = BeautifulSoup(sdata) mydivs = soup.findAll('div') for div in mydivs: if (div["class"]=="stylelistrow"): print divЯ получаю ...

1 ответ

Разбор HTML-файла в Python

У меня есть очень длинный HTML-файл, который выглядит именно так -HTML-файл [http://pastie.org/8413164], Я хочу иметь возможность разобрать файл так, чтобы я получил информацию в форме на кортеже. Пример: <tr> <td>Cech</td> <td>Chelsea</td> ...

0 ответов

Вы должны попробовать использовать плагин Python Selen. Требуется скачать драйвер для любого браузера, который вы используете. После этого вы сможете использовать селен для извлечения значений из HTML

аюсь извлечь эти данные (число) для многих страниц из HTML. Данные разные для каждой страницы. Когда я пытаюсь использовать soup.select ('span [class = "pull-right"]'), он должен дать мне номер, но приходит только тег. Я считаю, что это потому, ...

1 ответ

Как скачать файл с использованием селена?

Я пытаюсь получить ссылку для скачивания и скачать файлы. У меня есть файл журнала, который содержит следующие ...

3 ответа

Консольный вывод:

[/imgs/2vEuN.jpg] ние href для синего элемента - это то, к чему я хочу получить доступ из этого HTML Я пробовал несколько способов напечатать ссылку, но ничего не вышло. Мой код ниже: - discover_page = BeautifulSoup(r.text, 'html.parser') ...

1 ответ

Проблемы с красивым супом и Unicode

Я использую BeautifulSoup для анализа некоторых веб-страниц. Иногда я сталкиваюсь с «адской юникодной» ошибкой, подобной следующей: Глядя на источник этой статьи на TheAtlantic.com ...