Результаты поиска по запросу "html-parsing"

5 ответов

HTML-текст с тегами для форматированного текста в ячейке Excel

Есть ли способ взять HTML и импортировать его в Excel, чтобы он был отформатирован как расширенный текст (желательно с использованием VBA)? По сути, когда я вставляю в ячейку Excel, я хочу повернуть это: <html><p>This is a test. Will this text ...

2 ответа

Извлечь определенную таблицу из многостолового html-файла, используя perl [closed]

У меня есть HTML-файл с тремя таблицами. Но я хочу извлечь только одну таблицу из трех. Как мне это сделать?

3 ответа

Извлечение выбранных столбцов из таблицы с помощью BeautifulSoup

Я пытаюсь извлечь первый и третий столбцыэта таблица данных [http://www.samhsa.gov/data/NSDUH/2k10State/NSDUHsae2010/NSDUHsaeAppC2010.htm#tabC.7] используя BeautifulSoup. Посмотрев на HTML, первый столбец имеет<th> тег. Другой интересующий ...

ТОП публикаций

4 ответа

Perl заменяет вложенные блоки регулярным выражением

Мне нужно получить вложенные блоки в хэш-массив или хэш-дерево, чтобы иметь возможность заменить блоки с динамическим содержимым. Мне нужно заменить код между <!--block:XXX-->и первый закрывающий конец блока <!--endblock-->с моим динамическим ...

3 ответа

Как извлечь объект JSON, который был определен в блоке javascript HTML-страницы, используя Python?

Я загружаю HTML-страницы с данными, определенными в них следующим образом: ... <script type= "text/javascript"> window.blog.data = {"activity":{"type":"read"}}; </script> ...Я хотел бы извлечь объект JSON, определенный в 'window.blog.data'. Есть ...

2 ответа

Получить HTML под тегом, используя htmlparser python

Я хочу получить весь HTML под тегом и с помощью HTMLParser. В настоящее время я могу получить данные между тегами и мой код class LinksParser(HTMLParser): def __init__(self): HTMLParser.__init__(self) self.recording = 0 self.data = '' def ...

1 ответ

Как получить несколько классов в одном запросе, используя Beautiful Soup

Я хочу найти TD с class = "s" или class = "sb" в следующем HTML <tr bgcolor="#e5e5f3"><td class="sb" width="200" align="left">test1</td><td class="sb" align="right">5,774.0</td><td class="sb" align="right">4,481.0</td><td class="sb" ...

12 ответов

jQuery-подобный интерфейс для PHP?

Мне было любопытно, существует ли интерфейс / библиотека в стиле jQuery для PHP для обработки файлов HTML / XML - в частности, с использованием стиля jQuery селекторы [http://docs.jquery.com/Selectors]. Я хотел бы сделать такие вещи (все ...

7 ответов

PHP регулярное выражение для удаления тегов в документе HTML

Скажи, у меня есть следующий текст ..(content)............. <A HREF="http://foo.com/content" >blah blah blah </A> ...(continue content)...Я хочу удалить ссылку, и я хочу удалить тег (сохраняя текст между). Как мне сделать это с помощью ...

21 ответ

Как извлечь img src, title и alt из html с помощью php?

Я хотел бы создать страницу, где все изображения, которые находятся на моем сайте, перечислены с заголовком и альтернативным представлением. Я уже написал мне небольшую программу для поиска и загрузки всех HTML-файлов, но теперь я застрял в том, ...