Результаты поиска по запросу "beautifulsoup"

2 ответа

BeautifulSoup - извлечение значений атрибутов

2 ответа

Механизировать и BeautifulSoup для PHP? [закрыто]

Мне было интересно, есть ли что-нибудь подобное, как Mechanize или BeautifulSoup для PHP?

3 ответа

Декодирование HTML-объектов с помощью Python

ТОП публикаций

1 ответ

Почему я получаю «ResultSet» не имеет атрибута «findAll», используя BeautifulSoup в Python?

Поэтому я медленно изучаю Python и пытаюсь создать простую функцию, которая будет извлекать данные со страницы рекордов онлайн-игры. Это чужой код, который я переписал в одну функцию (что может быть проблемой), но я получаю эту ошибку. Вот ...

1 ответ

Как визуализировать содержимое тега в юникоде в BeautifulSoup?

Это суп со страницы подробностей поста WordPress: content = soup.body.find('div', id=re.compile('post')) title = content.h2.extract() item['title'] = unicode(title.string) item['content'] = u''.join(map(unicode, content.contents))Я хочу опустить ...

2 ответа

Я столкнулся с этим довольно старым вопросом только сейчас, и предоставленное решение не совсем подходило для меня. Дальнейшие исследования приводят меня к описанному выше подходу, и я подумал, что, возможно, было бы полезно поделиться тем, что я здесь использовал.

from BeautifulSoup import BeautifulStoneSoup xml_data = """ <doc> <test>test</test> <foo:bar>Hello world!</foo:bar> </doc> """ soup = BeautifulStoneSoup(xml_data) print soup.prettify() make = soup.find('foo:bar') print make # prints ...

2 ответа

 Родитель. Используя правильную функцию, вы можете сделать тест более эффективным.

рагмент HTML-файла, который я изучаю с Beautiful Soup. <td width="50%"> <strong class="sans"><a href="http:/website">Site</a></strong> <br />Я хотел бы получить<a href> для любой строки, которая имеет<strong class="sans"> и который находится ...

2 ответа

Веб-страница может лгать о ее кодировке. Выход выглядит как UTF-8. Если у вас есть str в конце, вам нужно будет декодировать его как UTF-8. Если вместо этого у вас есть Unicode, вам нужно сначала кодировать как Latin-1.

ющий код Python использует BeautifulStoneSoup для получения информации API LibraryThing для Толкина "Дети Хурина". import urllib2 from BeautifulSoup import BeautifulStoneSoup URL ...

1 ответ

Нет, это не встроенная опция. Источник довольно простой, хотя. Похоже, вы хотите изменить значение encodedName в теге.

ользую BeautifulStoneSoup для анализа XML-документа и изменения некоторых атрибутов. Я заметил, что он автоматически преобразует все теги XML в нижний регистр. Например, мой исходный файл имеет<DocData> элементы, которые BeautifulSoup преобразует ...

3 ответа

bs4 документы

ужно иметь возможность изменять каждую ссылку в HTML-документе. Я знаю, что мне нужно использоватьSoupStrainer но я не уверен на 100%, как это реализовать. Если бы кто-то мог направить меня на хороший ресурс или предоставить пример кода, это было ...