Результаты поиска по запросу "html-parsing"
обнуляет буфер на стандартный вывод.
аюсь создать скрипт BASH, который извлек бы данные из таблицы HTML. Ниже приведен пример таблицы, из которой мне нужно извлечь данные: <table border=1> <tr> <td><b>Component</b></td> <td><b>Status</b></td> <td><b>Time / Error</b></td> ...
После разбора строки на документ вы можете использовать на ней функции документа
я есть документ, который был сделан в jsoup, который выглядит так Document doc = Jsoup.connect("http://en.wikipedia.org/").get();Как я могу преобразовать этоdoc в строку.
Итак, это будет окончательный 100% ответ для проверки HTML? Нет. Но это начало, и немного больше работы можно сделать. Однако попытка сделать это внутри одного выполнения регулярного выражения не практична и не эффективна.
ся, что каждый вопрос о стековом потоке, когда запрашивающий использует регулярное выражение для получения некоторой информации из HTML, неизбежно будет иметь «ответ», который говорит, что не следует использовать регулярное выражение для анализа ...
JSOUP добавляет дополнительные закодированные вещи для HTML
На самом деле JSOUP добавляет некоторые дополнительные закодированные значения в мой HTML в моем парсере jSOUP. Я пытаюсь позаботиться об этом, String url ...
Для вашего примера, регулярное выражение будет
ли способ указать, что два или более регулярных выражений могут встречаться в любом порядке? Например, атрибуты XML могут быть записаны в любом порядке. Скажи, что у меня есть следующий XML: <a href="home.php" class="link" title="Home">Home</a> ...
Пожалуйста, представьте / объясните свой ответ, используя слова.
наилучший способ выделить весь текст между двумя тегами - например, текст между всеми тегами «pre» на странице.
существенная часть ответа. Любой может найти его в случае, если ссылка не работает.
мой лучший выбор для анализа HTML, если я не могу использовать BeautifulSoup или lxml? У меня есть некоторый код, который использует SGMLlib, но он немного низкоуровневый, и теперь он устарел. Я бы предпочел, если бы это могло стоить немного ...
Кажется, эта страница появляется в верхней части результатов поиска Google, поэтому я решил оставить комментарий с обновлением :)
приложении Rails 3.1 как безопасно встраивать некоторые данные JSON в документ HTML? Предположим, у меня есть это в действии контроллера: @tags = [ {name:"tag1", color:"green"}, {name:"</script><b>I can do something bad here</b>", color:"red"} ...
, FirefoxDriver и JavascriptExecutor.
ли я заполнить формы, выполнить события и функции JavaScript в Jsoup. Если да, то как я могу? Или я должен пойти на другой парсер.
Как мне разобрать HTML-страницу с Node.js
Мне нужно проанализировать (на стороне сервера) большое количество HTML-страниц. Мы все согласны с тем, что регулярное выражение не путь сюда. Мне кажется, что javascript - это родной способ парсинга HTML-страницы, но это предположение ...