Результаты поиска по запросу "beautifulsoup"
Очистите URL с помощью BeautifulSoup
Мой сценарий import BeautifulSoup as bs from BeautifulSoup import BeautifulSoup url_list = sys.argv[1] urls = [tag['href'] for tag ...
Поиск нерекурсивного подузла DOM в Python с использованием BeautifulSoup
Есть ли способ найти нерекурсивный подузел DOM в Python, используяBeautifulSoup [http://www.crummy.com/software/BeautifulSoup/bs4/doc/]? Например. рассмотреть разборpom.xml файл: <project ...
Разобрать все элементы с детьми из RSS-ленты
Из RSS-канала, как вы получаете строку всего, что внутри каждогопредметтег? Пример ввода (упрощенно): <?xml version="1.0" encoding="UTF-8"?> <rss version="2.0"> <channel> <title>Test</title> <item> <title>Hello world1</title> ...
Как визуализировать содержимое тега в юникоде в BeautifulSoup?
Это суп со страницы подробностей поста WordPress: content = soup.body.find('div', id=re.compile('post')) title = content.h2.extract() item['title'] = unicode(title.string) item['content'] = u''.join(map(unicode, content.contents))Я хочу опустить ...
Как загрузить все записи в бесконечной прокрутке одновременно, чтобы разобрать HTML в Python
Я пытаюсь извлечь информацию изэта страница [https://medium.com/top-100/december-2013], Страница загружает 10 элементов одновременно, и мне нужно прокрутить, чтобы загрузить все записи (всего 100). Я могу проанализировать HTML и получить ...
Разница между attrMap и attrs в BeautifulSoup
Я хотел бы знать, в чем разница междуattrMap а такжеattrs вBeautifulSoup [http://www.crummy.com/software/BeautifulSoup/]? Чтобы быть более точным, какие теги имеютattrs и которые имеютattrMap? >>> soup = BeautifulSoup.BeautifulSoup(source) >>> ...
Py2exe не находит bs4
В моем исходном коде у меня есть строка: from bs4 import BeautifulSoupКогда я использую py2exe, он прекрасно работает, но далее в выводе говорится: The following modules appear to be missing ['_scproxy', 'bs4']Я специально поставил bs4 в опциях ...
BeautifulSoup вызывает AttributeError, когда имя тега xml содержит заглавные буквы
Я пытаюсь получить все атрибуты XML для тегаName. Получение этой ошибки: AttributeError: 'NoneType' object has no attribute 'attrs'когда я выполнил следующий код: import BeautifulSoup as bs xml = ''' <Product ...
Использование BeautifulSoup для поиска html-строки
Я использую BeautifulSoup для поиска введенных пользователем строк на определенной странице. Например, я хочу посмотреть, находится ли строка «Python» на странице:http://python.org [http://python.org] Когда я использовал:find_string = ...
Есть ли эквивалент InnerText в BeautifulSoup?
С кодом ниже: soup = BeautifulSoup(page.read(), fromEncoding="utf-8") result = soup.find('div', {'class' :'flagPageTitle'})Я получаю следующий HTML: <div id="ctl00_ContentPlaceHolder1_Item65404" class="flagPageTitle" style=" ...