Результаты поиска по запросу "html-parsing"

4 ответа

Разбор HTML для получения контента с использованием C #

Я пишу приложение, которое сканирует группу моих веб-страниц. Вместо того, чтобы брать весь исходный код страницы, я хотел бы взять весь контент и сохранить его и иметь возможность сохранять страницу в виде простого текста в базе данных. Контент ...

4 ответа

Программное обеспечение, как автомобили. , , и это хорошо знать, если вы находитесь за рулем седана, минивэна, спортивного автомобиля или 18-ти колесного автомобиля. Да, они все водят, но у них разные цели, и их следует вести соответственно.

у сделать некоторые снимки экрана с Python 2.7, и у меня нет контекста для различий междуHTMLParser, SGMLParserили красивый суп. Все они пытаются решить одну и ту же проблему или существуют по разным причинам? Что является самым простым, что ...

1 ответ

Работает на меня, не знаю, о чем ты говоришь.

у использовать пакет гибкости HTML для анализа таблиц со сложных веб-страниц, но я как-то теряюсь в объектной модели. Я посмотрел на пример ссылки, но не нашел никаких табличных данных таким образом. Могу ли я использовать XPath для получения ...

ТОП публикаций

2 ответа

Не удается заставить CSS работать в iTextSharp (5.4.3) при создании PDF

У меня проблема при попытке применить файл css к моему pdf с использованием библиотеки генерации iTextSharp (5.4.3). в основном CSS не применяется вообще. У меня есть следующий метод в моем файле vb.net Protected Sub btnPreview_Click(ByVal ...

2 ответа

Этот трюк, кажется, работает и приводит к одной строке кода, но я не уверен, гарантированно ли это работает:

был моей первоначальной идеей в качестве решения, хотя вскоре стало очевидно, что парсер DOM будет более подходящим ... Я хотел бы преобразовать пробелы в&nbsp; между тегами PRE внутри строки текста HTML. Например: <table atrr="zxzx"><tr> ...

2 ответа

 стили.

могу использовать парсер DOM для удалениявсеатрибуты в тегах span, ноКромеэти два атрибута, <span style="text-decoration: underline;">cultura</span> принимать <span style="text-decoration: line-through;">heart</span> принимать отвергнуть ...

2 ответа

XPath может быть быстрее, но, возможно, не так хорошо поддерживается (хотя, похоже, он есть во всех современных браузерах).

ющий HTML-код показывает, что 3-й поиск (поиск «Практические рекомендации для профессионалов») не работает, так как текст «Практические рекомендации» находится между<strong></strong> тег ... Можно ли выполнить поиск XPath, чтобы обойти теги HTML ...

0 ответов

PHP Parse HTML-код

у проанализировать содержимое XHTML с помощью CURL. Как утилизироватьномер сделки, вес, рост, ширинамежду<table> теги. Как утилизироватьтолько содержимое этого HTML-документа и получить его как массивиспользуя CURL? transactions.php <table ...

5 ответов

Это не стабилизирует их. Он слепо копирует, часто вставляя их с ошибками.

полпути через анализатор HTML и нашел html5 определенэксплицитноправила большого пальца для разбораплохо сформированный HTML. (И я имел обыкновение выводить их из DTD, вздох) Мне нравится этот факт, но я хорошо знаю, что html5 еще не завершен ...

1 ответ

Какую версию PHP вы используете?

ользую эту библиотеку (PHP Simple HTML DOM parser) для разбора ссылки, вот код: function getSemanticRelevantKeywords($keyword){ $results = array(); $html = file_get_html("http://www.semager.de/api/keyword.php?q=". ...