Результаты поиска по запросу "beautifulsoup"
Где прячется BeautifulSoup4?
я сделалsudo pip install BeautifulSoup4 и получил ужасно оптимистичный ответ: Downloading/unpacking beautifulsoup4 Running setup.py egg_info for package beautifulsoup4 Installing collected packages: beautifulsoup4 Running setup.py install for ...
Извлечение выбранных столбцов из таблицы с помощью BeautifulSoup
Я пытаюсь извлечь первый и третий столбцыэта таблица данных [http://www.samhsa.gov/data/NSDUH/2k10State/NSDUHsae2010/NSDUHsaeAppC2010.htm#tabC.7] используя BeautifulSoup. Посмотрев на HTML, первый столбец имеет<th> тег. Другой интересующий ...
Только что установлен BeautifulSoup Python 3.3.0
Кто-нибудь знает, как это исправить. Я использую Mac OS 10.8.2 >>> from bs4 import BeautifulSoup Traceback (most recent call last): File "<stdin>", line 1, in <module> ...
Отрисовал HTML в простой текст, используя Python
Я пытаюсь преобразовать кусок HTML-текста с BeautifulSoup. Вот пример: <div> <p> Some text <span>more text</span> even more text </p> <ul> <li>list item</li> <li>yet another list item</li> </ul> </div> <p>Some other text</p> <ul> <li>list ...
Как извлечь объект JSON, который был определен в блоке javascript HTML-страницы, используя Python?
Я загружаю HTML-страницы с данными, определенными в них следующим образом: ... <script type= "text/javascript"> window.blog.data = {"activity":{"type":"read"}}; </script> ...Я хотел бы извлечь объект JSON, определенный в 'window.blog.data'. Есть ...
Разбор текста Python между двумя словами
Я использую Beautifulsoup и хочу извлечь весь текст из двух слов на веб-странице. Например, представьте следующий текст на сайте: This is the text of the webpage. It is just a string of a bunch of stuff and maybe some tags in between.Я хочу ...
Как получить несколько классов в одном запросе, используя Beautiful Soup
Я хочу найти TD с class = "s" или class = "sb" в следующем HTML <tr bgcolor="#e5e5f3"><td class="sb" width="200" align="left">test1</td><td class="sb" align="right">5,774.0</td><td class="sb" align="right">4,481.0</td><td class="sb" ...
Выпуск соскоб с Beautiful Soup
Я перебирал сайты, прежде чем использовать эту же технику. Но с этим сайтом вроде бы не работает. import urllib2 from BeautifulSoup import BeautifulSoup url ...
BeautifulSoup, куда ты кладешь мой HTML?
Я использую BS4 с python2.7. Вот начало моего кода (спасибо root): from bs4 import BeautifulSoup import urllib2 f=urllib2.urlopen('http://yify-torrents.com/browse-movie') html=f.read() soup=BeautifulSoup(html)Когда я печатаю html, его содержимое ...
Регулярное выражение Python для Beautiful Soup
Я использую Beautiful Soup для извлечения определенных тегов div, и кажется, что я не могу использовать простое сопоставление строк. На странице есть несколько тегов в виде <div class="comment form new"...>который я хочу игнорировать, а также ...