Результаты поиска по запросу "beautifulsoup"

2 ответа

Очистите URL с помощью BeautifulSoup

Мой сценарий import BeautifulSoup as bs from BeautifulSoup import BeautifulSoup url_list = sys.argv[1] urls = [tag['href'] for tag ...

1 ответ

Поиск нерекурсивного подузла DOM в Python с использованием BeautifulSoup

Есть ли способ найти нерекурсивный подузел DOM в Python, используяBeautifulSoup [http://www.crummy.com/software/BeautifulSoup/bs4/doc/]? Например. рассмотреть разборpom.xml файл: <project ...

1 ответ

Разобрать все элементы с детьми из RSS-ленты

Из RSS-канала, как вы получаете строку всего, что внутри каждогопредметтег? Пример ввода (упрощенно): <?xml version="1.0" encoding="UTF-8"?> <rss version="2.0"> <channel> <title>Test</title> <item> <title>Hello world1</title> ...

ТОП публикаций

1 ответ

Как визуализировать содержимое тега в юникоде в BeautifulSoup?

Это суп со страницы подробностей поста WordPress: content = soup.body.find('div', id=re.compile('post')) title = content.h2.extract() item['title'] = unicode(title.string) item['content'] = u''.join(map(unicode, content.contents))Я хочу опустить ...

3 ответа

Как загрузить все записи в бесконечной прокрутке одновременно, чтобы разобрать HTML в Python

Я пытаюсь извлечь информацию изэта страница [https://medium.com/top-100/december-2013], Страница загружает 10 элементов одновременно, и мне нужно прокрутить, чтобы загрузить все записи (всего 100). Я могу проанализировать HTML и получить ...

1 ответ

Разница между attrMap и attrs в BeautifulSoup

Я хотел бы знать, в чем разница междуattrMap а такжеattrs вBeautifulSoup [http://www.crummy.com/software/BeautifulSoup/]? Чтобы быть более точным, какие теги имеютattrs и которые имеютattrMap? >>> soup = BeautifulSoup.BeautifulSoup(source) >>> ...

1 ответ

Py2exe не находит bs4

В моем исходном коде у меня есть строка: from bs4 import BeautifulSoupКогда я использую py2exe, он прекрасно работает, но далее в выводе говорится: The following modules appear to be missing ['_scproxy', 'bs4']Я специально поставил bs4 в опциях ...

2 ответа

BeautifulSoup вызывает AttributeError, когда имя тега xml содержит заглавные буквы

Я пытаюсь получить все атрибуты XML для тегаName. Получение этой ошибки: AttributeError: 'NoneType' object has no attribute 'attrs'когда я выполнил следующий код: import BeautifulSoup as bs xml = ''' <Product ...

3 ответа

Использование BeautifulSoup для поиска html-строки

Я использую BeautifulSoup для поиска введенных пользователем строк на определенной странице. Например, я хочу посмотреть, находится ли строка «Python» на странице:http://python.org [http://python.org] Когда я использовал:find_string = ...

3 ответа

Есть ли эквивалент InnerText в BeautifulSoup?

С кодом ниже: soup = BeautifulSoup(page.read(), fromEncoding="utf-8") result = soup.find('div', {'class' :'flagPageTitle'})Я получаю следующий HTML: <div id="ctl00_ContentPlaceHolder1_Item65404" class="flagPageTitle" style=" ...