Результаты поиска по запросу "html-parsing"

1 ответ

Веб-очистка сайта с динамическим содержимым JavaScript

4 ответа

Perl заменяет вложенные блоки регулярным выражением

Мне нужно получить вложенные блоки в хэш-массив или хэш-дерево, чтобы иметь возможность заменить блоки с динамическим содержимым. Мне нужно заменить код между <!--block:XXX-->и первый закрывающий конец блока <!--endblock-->с моим динамическим ...

2 ответа

Как разобрать изображение с помощью jsoup

Я не могу найти никакого решения для этого! Мне нужно разобрать HTML-страницу с помощью jsoup, и мне нужно проанализировать изображение тоже, но я не могу это сделать! Это моеMainActivity public class MainActivity extends Activity { public ...

ТОП публикаций

2 ответа

Как разобрать изображение с помощью jsoup

1 ответ

JSOUP добавляет дополнительные закодированные вещи для HTML

На самом деле JSOUP добавляет некоторые дополнительные закодированные значения в мой HTML в моем парсере jSOUP. Я пытаюсь позаботиться об этом, String url ...

1 ответ

JSOUP добавляет дополнительные закодированные вещи для HTML

1 ответ

JSOUP HTML Parser

Есть ли способ получитьНачальная строка &amp; номер столбца а такжеокончание линии &amp; номер столбца элемента / тега?Я создаю HTML-редактор, который должен...

1 ответ

Как разобрать веб-страницу, которая включает в себя Javascript? [Дубликат]

На этот вопрос уже есть ответ здесь: Разобрать JavaScript с помощью jsoup [/questions/14904776/parse-javascript-with-jsoup] 1 ответУ меня есть веб-страница, которая создает таблицу с использованием Javascript. Прямо сейчас я использую JSoup в ...

1 ответ

Как разобрать веб-страницу, которая включает в себя Javascript? [Дубликат]

На этот вопрос уже есть ответ здесь:Разобрать JavaScript с помощью jsoup 1 ответУ нас есть веб-страница, которая создает таблицу с использованием Javascript....

1 ответ

Python BeautifulSoup скрести таблицы

Я пытаюсь создать скребок таблицы с BeautifulSoup. Я написал этот код Python: import urllib2 from bs4 import BeautifulSoup url = "http://dofollow.netsons.org/table1.htm" # change to whatever your url is page = urllib2.urlopen(url).read() soup = ...