Результаты поиска по запросу "beautifulsoup"

1 ответ

Это выводит:

аюсь извлечь данные из нескольких веб-страниц, которые не одинаковы в том, как они отображают свои таблицы. Мне нужно написать код, который будет искать текстовую строку, а затем перейти к таблице сразу после этой конкретной текстовой строки. ...

5 ответов

Как я могу получить CData из BeautifulSoup

У меня есть веб-сайт, который я очищаю, который имеет похожую структуру следующим образом. Я хотел бы иметь возможность получить информацию из блока CData. Я использую BeautifulSoup для извлечения другой информации со страницы, поэтому, если ...

4 ответа

Возможно, вам следует использовать селен, чтобы открыть страницу в реальном браузере, затем извлечь html, когда он будет готов, и проанализировать его с BeautifulSoup.

аю сценарий, который очищает игры базы данных Team Liquid от международных игр StarCraft 2. (Http://www.teamliquid.net/tlpd/sc2-international/games) Однако я сталкиваюсь с проблемой. У меня есть сценарий, проходящий по всем страницам, однако ...

ТОП публикаций

2 ответа

Вы можете проверить hello.parent.parent.name или hello.parent.parent.attrs или что-либо еще, что вы можете зафиксировать на

ел бы извлечь содержание "Hello world". Обратите внимание, что есть несколько магазинов<table> и тому подобное<td colspan="2"> на странице также. я попробовал следующее: hello = soup.find(text='Name: ') hello.findPreviousSiblingsНо ничего ...

7 ответов

Разница между BeautifulSoup и Scrapy Crawler?

Я хочу сделать сайт, который показывает сравнение между Amazon и E-Bay цены продукта. Что из этого будет работать лучше и почему? Я немного знаком с BeautifulSoupно не так много сScrapy гусеничный.

1 ответ

Использование BeautifulSoup для выбора блоков div в HTML

Я пытаюсь проанализировать несколько блоков div, используя Beautiful Soup, используя HTML с веб-сайта. Однако я не могу понять, какую функцию следует использовать для выбора этих блоков div. Я пробовал следующее: import urllib2 from bs4 import ...

2 ответа

Веб-страница может лгать о ее кодировке. Выход выглядит как UTF-8. Если у вас есть str в конце, вам нужно будет декодировать его как UTF-8. Если вместо этого у вас есть Unicode, вам нужно сначала кодировать как Latin-1.

ющий код Python использует BeautifulStoneSoup для получения информации API LibraryThing для Толкина "Дети Хурина". import urllib2 from BeautifulSoup import BeautifulStoneSoup URL ...

1 ответ

Как я могу получить текст из тега <dt> с <span> внутри?

Я пытаюсь извлечь текст изнутри<dt> пометить с<span> внутри на www.uszip.com: Вот пример того, что я пытаюсь получить: <dt>Land area<br><span class="stype">(sq. miles)</span></dt> <dd>14.28</dd>Я хочу получить14.28 из тега. Вот как я сейчас к ...

3 ответа

Поиск и замена в HTML с BeautifulSoup

Я хочу использовать BeautfulSoup для поиска и замены<\a> с участием<\a><br>, Я знаю, как открыть сurllib2 а затем разобрать, чтобы извлечь все<a> теги. Я хочу выполнить поиск и заменить закрывающий тег закрывающим тегом плюс разрыв. Любая помощь, ...

4 ответа

Программное обеспечение, как автомобили. , , и это хорошо знать, если вы находитесь за рулем седана, минивэна, спортивного автомобиля или 18-ти колесного автомобиля. Да, они все водят, но у них разные цели, и их следует вести соответственно.

у сделать некоторые снимки экрана с Python 2.7, и у меня нет контекста для различий междуHTMLParser, SGMLParserили красивый суп. Все они пытаются решить одну и ту же проблему или существуют по разным причинам? Что является самым простым, что ...