Результаты поиска по запросу "beautifulsoup"
BeautifulSoup - извлечение значений атрибутов
Если Beautiful Soup дает мне метку привязки, как это: <a class="blah blah" id="blah blah" href="link.html"></a>Как бы я получить значениеhref атрибут?
Красивая супружеская структура с бирками br
Я пытаюсь разобрать HTML-документ, используя библиотеку BeautifulSoup Python, но структура искажается<br> теги. Позвольте мне привести вам пример. Введите HTML: <div> some text <br> <span> some more text </span> <br> <span> and more ...
Как переустановить lxml?
Я использую Python 2,7.5 на Mac 10.7.5, Beautifulsoup 4.2.1. Я собираюсь проанализировать страницу XML с помощью библиотеки lxml, как описано в руководстве по BeautifulSoup. Однако, когда я запускаю свой код, он показывает bs4.FeatureNotFound: ...
Beautiful Soup: доступ к элементам <li> из <ul> без идентификатора
Я пытаюсь очистить людей, у которых есть дни рождения от этогоСтраница википедии [http://en.wikipedia.org/wiki/January_1] Вот существующий код: hdr = {'User-Agent': 'Mozilla/5.0'} site = "http://en.wikipedia.org/wiki/"+"january"+"_"+"1" req ...
очистить результаты Google с Python [закрыто]
Я хотел бы получить примерное количество результатов от Google по ключевому слову. Я использую Python3.3 и пытаюсь выполнить эту задачу с помощью BeautifulSoup и urllib.request. Это мой простой код def numResults(): try: page_google ...
BeautifulSoup - добавление атрибута в тег
Вопрос для вас здесь, я пытаюсь добавить атрибут к тегу, задаваясь вопросом, могу ли я использовать метод BeautifulSoup или использовать обычные манипуляции со строками. Пример, вероятно, прояснит это, поскольку это странное объяснение. Как ...
Поиск следующего встречающегося тега и вложенного текста с помощью Beautiful Soup
Я пытаюсь разобрать текст между тегом
красивый суп просто получить значение внутри тега
Следующая команда:
BeautifulSoup get_text от find_all
Это моя первая работа с веб-соскобом. Пока я могу перемещаться и находить ту часть HTML, которую я хочу. Я могу напечатать это также. Проблема заключается в ...