Результаты поиска по запросу "beautifulsoup"

аюсь извлечь данные из нескольких веб-страниц, которые не одинаковы в том, как они отображают свои таблицы. Мне нужно написать код, который будет искать текстовую строку, а затем перейти к таблице сразу после этой конкретной текстовой строки. ...

parsing python html

2 ответа

Это очень мало объяснений. Хью, я считаю твой код более убедительным, чем цитируемый пост. Нет, не в ограниченных случаях можно использовать молоток на винте вместо отвертки: каждый раз, когда нужно, чтобы программа работала быстрее, вы увидите это в редактировании моего поста.

му, когда я решил разобрать контент с сайта. Например, http://allrecipes.com/Recipe/Slow-Cooker-Pork-Chops-II/Detail.aspx [http://allrecipes.com/Recipe/Slow-Cooker-Pork-Chops-II/Detail.aspx] Я хочу разобрать ингредиенты в текстовый файл. ...

html-parsing python

1 ответ

Я думаю, что это удалит все содержимое тега h2. Я просто хочу заменить имя тега и оставить все остальное без изменений.

ользую python + BeautifulSoup для разбора HTML-документа. Теперь мне нужно заменить все<h2 class="someclass"> элементы в документе HTML, с<h1 class="someclass">. Как я могу изменить имя тега, не меняя ничего в документе?

ТОП публикаций

Test Test Test Test Test Test

21 Startup Ideas to Start Profitable Business in 2020

How To Build E-Learning Platform From Scratch: The Complex Guide From Idea to MVP

How to Raise Your Own SaaS Product off the Ground and Avoid Common Pitfalls

python html html-parsing

3 ответа

Пожалуйста, не полагайтесь на строковое представление объектов для логики вашего кода.

я есть следующий HTML-код, который находится в большем документе <br /> Important Text 1 <br /> <br /> Not Important Text <br /> Important Text 2 <br /> Important Text 3 <br /> <br /> Non Important Text <br /> Important Text 4 <br />В настоящее ...

html python

9 ответов

Это сработало для меня:

я возникают проблемы при разборе html-элементов с атрибутом "class" с помощью Beautifulsoup. Код выглядит так soup = BeautifulSoup(sdata) mydivs = soup.findAll('div') for div in mydivs: if (div["class"]=="stylelistrow"): print divЯ получаю ...

python tree-traversal

2 ответа

Мне больше понравился этот ответ, так как при небольшом посредничестве можно отслеживать родительские теги терминальных узлов, что может быть причиной необходимости итерации в глубину. Тот факт, что BeautifulSoup уже делает это, не является проблемой @ J.F.Sebastian

ли способ сделать DFT на дереве разбора BeautifulSoup? Я пытаюсь сделать что-то вроде запуска в корне, обычно получить все дочерние элементы, а затем для каждого дочернего элемента получить их дочерние элементы и т.д. , Проблема в том, что я не ...

xml elementtree google-app-engine python

0 ответов

Ах, BeautifulSoup. Это магия! Благодарю.

оследующий XML [http://www.boardgamegeek.com/xmlapi/boardgame/13]Как получить XML, а затем проанализировать его, чтобы получить значение для<age>? <boardgames> <boardgame objectid="13"> ...

python lxml

1 ответ

w3.org/TR/html4/struct/links.html#h-12.3.1

то у lxml есть особенность: make_links_absolute:

parsing html python

3 ответа

миль лучше, чем просто BeautifulSoup. Это позволяет вам делать dom.cssselect («ваш селектор»), который спасает жизнь. Просто убедитесь, что у вас установлена хорошая версия BeautifulSoup. 3.2.1 работает лакомство

ужно проанализировать URL-адрес, чтобы получить список URL-адресов, которые ссылаются на страницу сведений. Затем с этой страницы мне нужно получить все подр...

screen-scraping python

2 ответа