Результаты поиска по запросу "html-parsing"
Как я могу использовать регулярное выражение, чтобы получить тег 'img'?
Я хочу взятьimg тег из текста, возвращенного из данных JSON, как это. Я хочу взять это из строки: <img class="img" src="https://fbcdn-photos-c-a.akamaihd.net/hphotos-ak-frc3/1239478_598075296936250_1910331324_s.jpg" alt="" />Какое регулярное ...
BeautifulSoup не может проанализировать состояние длительного просмотра
Я пытаюсь использовать BeautifulSoup4 для анализа html, полученного из http://exporter.nih.gov/ExPORTER_Catalog.aspx?index=0 [http://exporter.nih.gov/ExPORTER_Catalog.aspx?index=0]Если я распечатаю полученный суп, он заканчивается ...
BeautifulSoup не может проанализировать состояние длительного просмотра
Я пытаюсь использовать BeautifulSoup4 для анализа html, полученного изhttp://exporter.nih.gov/ExPORTER_Catalog.aspx?index=0 Если я распечатаю полученный суп,...
ASP.NET - анализировать / запрашивать HTML перед передачей и вставлять ссылки на классы CSS
Как веб-разработчик, я чувствую, что слишком много времени тратится на CSS. Я пытаюсь найти решение, в котором я могу написатьre-usable CSS то есть классы и ...
как пропустить файл внутри файла tar, чтобы получить конкретный файл
я пытаюсь получить содержимое HTML-файла, который присутствует внутри файла tar (я использую Visual C ++ для выполнения моей задачи). Мой подход заключается в том, чтобы сохранить tar в буфере, используя поток, а затем сохранить содержимое html в ...
Разбор вложенного списка HTML с BeautifulSoup
Мне нужно проанализировать вложенный список HTML и преобразовать его в dict parent-child. Учитывая этот список: <ul> <li>Operating System <ul> <li>Linux <ul> <li>Debian</li> <li>Fedora</li> <li>Ubuntu</li> </ul> </li> <li>Windows</li> <li>OS ...
Beautiful Soup: доступ к элементам <li> из <ul> без идентификатора
Я пытаюсь очистить людей, у которых есть дни рождения от этогоСтраница википедии [http://en.wikipedia.org/wiki/January_1] Вот существующий код: hdr = {'User-Agent': 'Mozilla/5.0'} site = "http://en.wikipedia.org/wiki/"+"january"+"_"+"1" req ...