Результаты поиска по запросу "beautifulsoup"

1 ответ

Лоскутный ответ отличается от ответа браузера

Я пытаюсь наскрести эту страницу с помощью скрапа: http://www.barnesandnoble.com/s?dref=4815&sort=SA&startat=7391и ответ, который я получаю, отличается от того, что я вижу в браузере. Ответ браузера имеет правильную страницу, а ответ ...

3 ответа

ошибка импорта из-за bs4 против BeautifulSoup

Я пытаюсь использоватьbeautifulsoup совместимыйlxml и это дает мне ошибку: from lxml.html.soupparser import fromstring Traceback (most recent call last): File "<stdin>", line 1, in <module> ...

3 ответа

BeautifulSoup в Python - получение n-го тега типа

У меня есть HTML-код, который содержит много<table>в этом. Я пытаюсь получить информацию во второй таблице. Есть ли способ сделать это без использованияsoup.findAll('table') ? Когда я используюsoup.findAll('table')Я получаю ошибку: ValueError: ...

ТОП публикаций

1 ответ

Странная синтаксическая ошибка при использовании beautifulsoup.find ()

Это может быть совершенно очевидно, но я озадачен (вроде как новичок в python, извините): page = urllib2.urlopen("http://www.somerandompage.com") soup = BeautifulSoup(page) currentDate = soup.find("span", class="posted-on")Я ищу следующий ...

2 ответа

Разбор HTML с BeautifulSoup

(Картинка маленькая, вот еще одна ссылка:http://i.imgur.com/OJC0A.png [https://i.imgur.com/OJC0A.png]) Я пытаюсь извлечь текст обзора внизу. Я пробовал это: y = soup.find_all("div", style = "margin-left:0.5em;") review = y[0].text Проблема в ...

1 ответ

Как я могу получить элемент путем сопоставления текста в его атрибуте в BeautifulSoup

У меня есть этот код <a title="Next Page - Results 1 to 60 " href="bla bla" class="smallfont" rel="next">&gt;</a>Я хочу схватитьa элемент и получить HREF. как я могу соответствоватьtitle приписать сNext Page Я хочу частично сопоставить текст в ...

1 ответ

Python BeautifulSoup: поиск по шаблону по атрибуту / идентификатору

У меня есть это: dates = soup.findAll("div", {"id" : "date"})Тем не менее, мне нужен id для поиска по шаблонуid может бытьdate_1, date_2 и т.п.

1 ответ

Как сохранить обратно изменения, сделанные в файле HTML, используя BeautifulSoup в Python?

У меня есть скрипт ниже, который изменяетhref атрибуты в файле HTML (в будущем это будет список файлов HTML в каталоге). Используя BeautifulSoup мне удалось получить доступ к значениям тегов и изменить их, как я хочу, но я не знаю, как сохранить ...

4 ответа

Как я могу увидеть все заметки к записи Tumblr из Python?

Скажем, я смотрю на следующий пост Tumblr: http://ronbarak.tumblr.com/post/40692813... [http://ronbarak.tumblr.com/post/40692813320] Это (в настоящее время) имеет 292 примечания. Я хотел бы получитьвсевышеупомянутые примечания, использующие ...

7 ответов

Как обращаться с IncompleteRead: в Python

Я пытаюсь получить некоторые данные с веб-сайта. Однако это возвращает меняincomplete read, Данные, которые я пытаюсь получить, представляют собой огромный набор вложенных ссылок. Я провел некоторые исследования в Интернете и обнаружил, что это ...