Результаты поиска по запросу "beautifulsoup"

1 ответ

BeautifulSoup, чтобы очистить адрес

Я использую код в дальнем конце, чтобы получитьссылка на сайтиИмя Масджид, Однако я хотел бы также получитьнаименованиеа такжеадрес улицы, Пожалуйста, помогите, я застрял. В настоящее время я getti, нг следующее Ссылка на сайт: <div ...

2 ответа

 Родитель. Используя правильную функцию, вы можете сделать тест более эффективным.

рагмент HTML-файла, который я изучаю с Beautiful Soup. <td width="50%"> <strong class="sans"><a href="http:/website">Site</a></strong> <br />Я хотел бы получить<a href> для любой строки, которая имеет<strong class="sans"> и который находится ...

2 ответа

Скачивайте файлы используя запросы и BeautifulSoup

Я пытаюсь загрузить кучу файлов PDF изВот [http://www.desconversa.com.br/matematica/wp-content/uploads/2013/01/]с помощью Запросыа такжеbeautifulsoup4, Это мой код: import requests from bs4 import BeautifulSoup as bs _ANO = '2013/' _MES = ...

ТОП публикаций

2 ответа

Я столкнулся с этим довольно старым вопросом только сейчас, и предоставленное решение не совсем подходило для меня. Дальнейшие исследования приводят меня к описанному выше подходу, и я подумал, что, возможно, было бы полезно поделиться тем, что я здесь использовал.

from BeautifulSoup import BeautifulStoneSoup xml_data = """ <doc> <test>test</test> <foo:bar>Hello world!</foo:bar> </doc> """ soup = BeautifulStoneSoup(xml_data) print soup.prettify() make = soup.find('foo:bar') print make # prints ...

5 ответов

 код нельзя слепо копировать).

у сканер с Python, используя BeautifulSoup, и все шло гладко, пока я не наткнулся на этот сайт: http://www.elnorte.ec/ [http://www.elnorte.ec/] Я получаю содержимое с библиотекой запросов: r = requests.get('http://www.elnorte.ec/') content = ...

2 ответа

Python BeautifulSoup findAll по атрибуту «класс»

Я хочу сделать следующий код, о котором говорится в документации BS, единственная проблема в том, что слово «класс» - это не просто слово. Его можно найти внутри HTML, но это также ключевое слово python, которое заставляет этот код выдавать ...

3 ответа

как достать из таблицы прекрасный суп из питона?

Я пытаюсь удалить год и победителей (первый и второй столбцы) из таблицы «Список финальных матчей» (вторая таблица) из http://en.wikipedia.org/wiki/List_of_FIFA_World_Cup_finals [http://en.wikipedia.org/wiki/List_of_FIFA_World_Cup_finals]Я ...

1 ответ

Исключая нежелательные результаты findAll с использованием BeautifulSoup

Используя BeautifulSoup, я собираюсь очистить текст, связанный с этим HTML-хуком: <p class="review_comment">Итак, используя простой код следующим образом, content = page.read() soup = BeautifulSoup(content) results = ...

2 ответа

Разбор нестандартного XML (тэг CDATA)

Когда я хочу проанализировать XML-документ в Python с использованием библиотеки BeautifulSoup, я столкнулся с некоторыми проблемами. XML-документ, который я хочу проанализировать: <item> <title><![CDATA[Title Sample]]></title> ...

1 ответ

Пакетная загрузка текста и изображений с URL с помощью Python / urllib / beautifulsoup?

Я просматривал несколько постов здесь, но я просто не могу разобраться в пакетной загрузке изображений и текста с заданного URL с помощью Python. import urllib,urllib2 import urlparse from BeautifulSoup import BeautifulSoup import os, sys def ...