Результаты поиска по запросу "beautifulsoup"
Это выводит:
аюсь извлечь данные из нескольких веб-страниц, которые не одинаковы в том, как они отображают свои таблицы. Мне нужно написать код, который будет искать текстовую строку, а затем перейти к таблице сразу после этой конкретной текстовой строки. ...
Это очень мало объяснений. Хью, я считаю твой код более убедительным, чем цитируемый пост. Нет, не в ограниченных случаях можно использовать молоток на винте вместо отвертки: каждый раз, когда нужно, чтобы программа работала быстрее, вы увидите это в редактировании моего поста.
му, когда я решил разобрать контент с сайта. Например, http://allrecipes.com/Recipe/Slow-Cooker-Pork-Chops-II/Detail.aspx [http://allrecipes.com/Recipe/Slow-Cooker-Pork-Chops-II/Detail.aspx] Я хочу разобрать ингредиенты в текстовый файл. ...
Я думаю, что это удалит все содержимое тега h2. Я просто хочу заменить имя тега и оставить все остальное без изменений.
ользую python + BeautifulSoup для разбора HTML-документа. Теперь мне нужно заменить все<h2 class="someclass"> элементы в документе HTML, с<h1 class="someclass">. Как я могу изменить имя тега, не меняя ничего в документе?
Пожалуйста, не полагайтесь на строковое представление объектов для логики вашего кода.
я есть следующий HTML-код, который находится в большем документе <br /> Important Text 1 <br /> <br /> Not Important Text <br /> Important Text 2 <br /> Important Text 3 <br /> <br /> Non Important Text <br /> Important Text 4 <br />В настоящее ...
Это сработало для меня:
я возникают проблемы при разборе html-элементов с атрибутом "class" с помощью Beautifulsoup. Код выглядит так soup = BeautifulSoup(sdata) mydivs = soup.findAll('div') for div in mydivs: if (div["class"]=="stylelistrow"): print divЯ получаю ...
Мне больше понравился этот ответ, так как при небольшом посредничестве можно отслеживать родительские теги терминальных узлов, что может быть причиной необходимости итерации в глубину. Тот факт, что BeautifulSoup уже делает это, не является проблемой @ J.F.Sebastian
ли способ сделать DFT на дереве разбора BeautifulSoup? Я пытаюсь сделать что-то вроде запуска в корне, обычно получить все дочерние элементы, а затем для каждого дочернего элемента получить их дочерние элементы и т.д. , Проблема в том, что я не ...
Ах, BeautifulSoup. Это магия! Благодарю.
оследующий XML [http://www.boardgamegeek.com/xmlapi/boardgame/13]Как получить XML, а затем проанализировать его, чтобы получить значение для<age>? <boardgames> <boardgame objectid="13"> ...
w3.org/TR/html4/struct/links.html#h-12.3.1
то у lxml есть особенность: make_links_absolute:
миль лучше, чем просто BeautifulSoup. Это позволяет вам делать dom.cssselect («ваш селектор»), который спасает жизнь. Просто убедитесь, что у вас установлена хорошая версия BeautifulSoup. 3.2.1 работает лакомство
ужно проанализировать URL-адрес, чтобы получить список URL-адресов, которые ссылаются на страницу сведений. Затем с этой страницы мне нужно получить все подр...