Результаты поиска по запросу "beautifulsoup"
Python - Запросы / RoboBrowser - ASPX POST JavaScript
Я портирую bash-скрипт, который использует curl и POST-файлы полезных нагрузок в коде на URL-адреса и работает. Основная проблема заключается в том, что с ro...
Разбор нестандартного XML (тэг CDATA)
Когда я хочу проанализировать XML-документ в Python с использованием библиотеки BeautifulSoup, я столкнулся с некоторыми проблемами. XML-документ, который я хочу проанализировать: <item> <title><![CDATA[Title Sample]]></title> ...
BeautifulSoup: просто попасть внутрь тега, независимо от того, сколько в нем тегов
Я пытаюсь очистить весь внутренний HTML от
Python получает запрос, возвращающий другой HTML, чем исходный вид
Я пытаюсь извлечь фанфик из URL-адреса нашего собственного архива, чтобы использовать библиотеку NLTK для лингвистического анализа. Однако каждая попытка уда...
Я столкнулся с этим довольно старым вопросом только сейчас, и предоставленное решение не совсем подходило для меня. Дальнейшие исследования приводят меня к описанному выше подходу, и я подумал, что, возможно, было бы полезно поделиться тем, что я здесь использовал.
from BeautifulSoup import BeautifulStoneSoup xml_data = """ <doc> <test>test</test> <foo:bar>Hello world!</foo:bar> </doc> """ soup = BeautifulStoneSoup(xml_data) print soup.prettify() make = soup.find('foo:bar') print make # prints ...
Как запретить BeautifulSoup4 добавлять дополнительные теги <html> <body> в суп? [Дубликат]
На этот вопрос уже есть ответ: Не добавляйте теги html, head и body автоматически, Beautifulsoup [/questions/14822188/dont-put-html-head-and-body-tags-automatically-beautifulsoup] 5 ответов В версиях BeautifulSoup до 3 я мог взять любой кусок ...